Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
ASCII.jp:【無料】グーグル神AIツール5選 「Google AI Studio」はこれがやばい (3/7)
[go: Go Back, main page]

このページの本文へ

田口和裕の「ChatGPTの使い方!」 第35回

【無料】グーグル神AIツール5選 「Google AI Studio」はこれがやばい

2025年06月27日 17時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

【神機能2】自然な日本語音声合成

 2つ目の神機能は、テキストを自然な日本語音声に変換する音声合成機能だ。単純な読み上げではなく、感情やトーンを指定して「明るく」「悲しげに」「興奮気味に」といった演技まで可能だ。

 競合の状況を見ると、ChatGPTには音声合成機能自体が存在せず、Claudeにも未対応だ。市販の音声合成サービスは月額数千円が相場だが、Google AI Studioなら完全無料で利用できる。

 実際に使ってみよう。Google AI Studioにログインし、左側サイドメニューから「Generate Media」を選択、続けて「Gemini speech generation」をクリックする。

 

 音声合成には一人の話者が読み上げる「Single-Speaker audio」と複数の話者が会話形式で読み上げる「Multi-Speaker audio」の2つのモードが用意されている。今回は画面右側のセッティング画面で「Single-Speaker audio」を選択しよう。

「Single-Speaker audio」を選択

 次に読み上げるボイスの種類を選択する。再生ボタンを押すとサンプルが再生される。現在30種類のボイスが用意されている。

 設定が終わったら「Text」欄に読み上げてもらいたい内容を入力しよう。また、必須項目ではないが「Style Instruction」欄には感情表現を入力できる。

Style Instruction:あたたかく親しみやすい口調で

Text:皆様、本日はお忙しい中お集まりいただき、誠にありがとうございます。それでは、プレゼンテーションを開始させていただきます。

 入力が終わったら「Run」をクリック。

 数秒で音声が生成される。「︙」をクリックすることでファイルをWAV形式でダウンロードできる。音量や再生速度の調整も可能だ。

 下記ムービーで生成した音声を聞くことができる。

 試しにStyle Instructionを下記に変更してみよう。

Style Instruction:とても威圧的な口調で

 「Multi-Speaker audio」も試してみよう。

 マルチの場合は2人分のボイスを指定する必要がある。

 会話形式でテキストを入力していこう。

 特筆すべきは感情表現の豊富さだ。「嬉しい」「悲しい」「怒り」「驚き」など基本感情はもちろん、「ささやき」「叫び」といった表現方法まで指定できる。同じテキストでも全く異なる印象の音声を作り出せるのは驚きだ。ちなみに下記は「ツンデレ」でお願いしてみたものだ。

 ビジネスではプレゼンテーション用のナレーション作成、研修動画の音声収録、電話応答システムの音声として活用できる。個人利用なら YouTube動画のナレーション、ポッドキャスト制作、語学学習用の音声教材作成などに便利だろう。

 市販の音声合成サービスは月額3,000円〜10,000円が相場で、感情表現まで対応するプロ向けツールは月額数万円に達する。それがGoogle AI Studioなら完全無料。「こんな高機能な音声合成がタダでいいの?」と思わず疑ってしまうレベルの神仕様である。

 ただし、商用利用時には注意点がある。無料版では生成された音声データがGoogleの製品改善に使用される可能性があるため、機密情報を含む音声生成は避けるべきだ。

 本格的な商用利用を検討する場合は、Googleの有料プラン(支払い設定を有効化)への切り替えを推奨する。また、生成された音声には目に見えないSynthID透かしが埋め込まれるため、AI生成であることが識別可能になっている点も覚えておこう。

カテゴリートップへ

この連載の記事
ピックアップ