オープンソース VOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
◆◆◆ 最初のきっかけは「中学3年生の夏、止まらなかった鼻血」 ――「全身性エリテマトーデス」とはどのような病気でしょうか? 後藤邑子さん(以下、後藤) 自己免疫疾患のひとつです。本来、免疫というのは外から入ってきたウイルスなどの外敵と戦うものですが、それが自分の体の細胞を攻撃してしまう病気です。 血液だったり、臓器だったり、あるいは皮膚だったりと、どこを攻撃するのかわからないので、「全身性」といいます。原因は、まだハッキリとは突き止められていないようです。 ――病気が発覚したのはいつでしたか? 後藤 2012年に倒れて入院し、そのときに検査してわかりました。 もともと私は別の自己免疫疾患、特発性血小板減少性紫斑病(血小板に対する「自己抗体」がつくられることで、血小板が破壊され、出血の危険が高まる病気。国が指定する難病の対象)というのを長く患っていたので、その症状がひどくなったのかと思って
なぜオジサンは一人でブツブツと喋るのか。 それは、音声入力こそが最強のプロンプトを生み出すからである。 両手をキーボードから解放する時が来た。 忙しい人向けの説明 さっそくChatGPTを開き、iOSのマイクから音声入力を起動したら、 これを使って入力 「本しゃぶりというブログにChatGPTの使い方について、面白そうな記事があったのでメモ。なんか音声入力を使うといいらしい。これまで話した内容について整理し、マークダウンで出力して」 と喋っておこう。誤字脱字などの修正をせずに投稿すればいい。 以上。 音声入力と生成AIの組み合わせが強い 生成AIをうまく使いたいならば、詳細なコンテキストを与えるのが良い。しかし、ここに大きな問題があった。 人間というものは楽をしたがる生き物である。特にAIに助けを求めるような人は、なおさらだ。文章を入力することに面倒くささを感じ、つい最小限の指示で済ませて
三行説明 アメリカ英語の発音について説明するよ!発音とかリスニングの役に立てばいいね! アクセント・シュワー・リンキングや個別の母音・子音についての知識が重要だと思っている(ので幅広く説明する)よ! 個人的に大事だと思っているところから順に説明していくし、大事だと思ってるトピックはなるべく網羅するよ! 目次 三行説明 目次 前置き この記事の目的 想定読者 筆者の英語力について 発音 全体的な話 アクセントに関係する現象 アクセントとリズム 日本語のアクセントとリズム 英語のアクセント アクセント周りの発音記号 英語のリズム (アクセントの等時性) アクセントのない母音の中和 シュワー ハイシュワー r音性母音 /i/ /jʊ/ シュワーとハイシュワーの使い分け 助動詞、前置詞、冠詞などの弱形 母音のないところに母音を付け足さない 日本語の母音の無声化 リンキング 開放させない子音 閉鎖は
林原めぐみオフィシャルブログ Powered by Ameba 林原めぐみオフィシャルブログ Powered by Ameba で いいんだろうか 本当に心配になって来ました 以下変更 私が韓国YouTuberさんを取り上げたら 韓国の友人から連絡がありました。 今、韓国は国内で右派、左派で対立があり貴方が右派を支持するみたいにとれる発言は左派が悲しむ。また逆に左派を支持するような発言をしたら右派が悲しむ。『いらぬ争いに火をつける事になる』と怒られました。『部外者』である私が安易に取り上げてしまう事で悲しむ人がいるとゆー事実 今更だし、さらに火を注ぐ事に なるかもだけれど傷ついた人が いたならごめんなさい。 その部分を割愛しました。 既に傷ついてしまった人に 手は伸ばせないけれど これ以上傷つく人が増えないように。 こんな狭い文章では伝わらないと思う けれど、声を上げる事すら冷ややかに 日
田中光はXにて「いつもお世話になっている皆様へ」と切り出し、「令和6年8月20日、私の実母であります声優 田中敦子が永眠いたしました」と報告。 「田中敦子を愛してくださったファンの皆様、 生前お世話になりました業界関係者の皆様、 本人に変わりまして深謝いたします。このような形で親子関係をお伝えすることとなりまして、 非常に残念でなりません」と惜しんだ。 「本人の意向により具体的な病名は伏せさせていただきますが、 約1年に及ぶ闘病生活も含め、真面目で凛々しく、ちょっぴりお茶目な、 田中らしい人生だったように思います。こんなに自慢の母を持つことができ、本当に幸せです」と闘病生活だったことを説明。 「最後になりますが、田中敦子が真摯に携わってきた作品を、 田中敦子が愛情を注いできたキャラクターを、 田中敦子という声優をどうか忘れないでください。尊敬する女優/声優であり、愛するお母さんへ愛を込めて
骨伝導ヘッドセットAfterShokzを使い始めて1年以上。 もう完全に手放せない。 メガネと同じくらい装着しっぱなしの生活になっている。 骨伝導ヘッドセットを使い始めて1年 1年ほど前に骨伝導ヘッドセットの記事を書いた。 この時は使い始めて1ヶ月の時点だった。今回はさらに1年使った感想である。まずは前回の復習から始めよう。 俺が使っているのはワイヤレスの骨伝導ヘッドセット『AfterShokz Air』である。 AfterShokz Airオープンイヤーワイヤレス骨伝導ヘッドフォン、ポータブル収納ケース付き、ミッドナイトブルー AftershokzAmazon 骨伝導なので、常に耳は開放状態となる。外部の音も普通に聞こえるし、着けっぱなしでも外耳炎になるリスク*1も無い。 Msahid manik / CC BY-SA, Link この特徴のおかげで1年前 (使用1ヶ月) の時点で、平日
スマートホーム化する価値とは、家が賢くなることではない。 住居者が愚かでなくなることだ。 システムの一部になることが快適な生活を送るカギである。 使って初めて分かる価値 Amazonのスマートスピーカー、Echo Dotを使い始めて約10ヶ月が経つ。 Echo Dot (エコードット)第3世代 - スマートスピーカー with Alexa、チャコール AmazonAmazon 買う前は音声コントロールに対して疑問を持ってた。今のAIの賢さで本当に便利なのかと。しかし今は違う。スマート化されていない生活など考えられないし、何より俺の行動が変わった。日常生活で生じるささいなミスが減ったのである。 やっていること自体に新鮮味は無いが、実際に使っているからこそ語れるというものはある。ただスマートスピーカーの紹介をするのではなく、俺の考え方がどのように変化したか書いていきたい。 キッチンの照明を消す
現実世界にさようなら。「VRChat」を今さら始めたら,あっという間に美少女に堕ち,100万円近く飛んでいった 編集部:御月亜希 2024年9月末。本当に,本当に今さらなのですが,「VRChat」を始めました。それから5か月ほどが経った今,私の生活は完全にこのVR SNSに乗っ取られてしまい,ログインしない日はありません。☆5キャラを引くためのガチャも,札束でビンタする対人要素もないのに,もう100万円近くのお金が飛んでいきました。いったいどこで,なぜ足を踏み外してしまったのでしょうか……。 いえ,心当たりはいっぱいあるんですけど,とにかく危険な世界なんですよ,VRChatは。多くのプレイヤーは平和に楽しく過ごしているのだと思うのですが,恐ろしいことに,私のようにあっという間に壊れてしまう人もいます。何があったのかを,ここに残しておきましょう。お砂糖の話とかではないですよ。 本稿のスクリー
鬼龍院翔(41歳) @kiryuintw ゴールデンボンバー全国ツアー「喜矢武豊」開催中。曲知らなくて全然OK!棒立ち座りっぱなし大歓迎!予備知識ゼロでも楽しめるライブを心掛けています。現在チケットが買える公演は🗓️9/17(水)愛媛 🗓️10/18(土)19(日)神戸🗓️12/6(土)7(日)東京となってます。購入は下記のリンクへ🔗お待ちしてます💁 https://t.co/KtIEJ8Hr00 リンク ゴールデンボンバー 鬼龍院翔オフィシャルブログ「キリショー☆ブログ」Powered by Ameba ゴールデンボンバー 鬼龍院翔『こんばんは、今ひとりですか?ちょっとお時間宜しいですか?』 キスミー!全国27人の鬼龍院大好きっ子の皆さんこんにちは(^-^)鬼龍院翔です今日は沖縄ライブ1日目でした既にヘトヘトだぜセンキュー!明日も頑張るぜ!(^-^… 鬼龍院翔(40歳) @ki
「ただの記号論なんですよ、セルなんて。マーカーでアスカの絵が描いてあって、そこから宮村優子の声がすれば、もう十二分にアスカなんですよ」 庵野秀明が『月刊Newtype』のインタビューでそう言ったのはもう二十数年前の1996年6月号、最終回26話が放映されてファンの間で大論争になった直後のことだ。それはセルアニメーションにこだわるアニメファンを痛烈に批判し、これはただの紙に描かれた絵だ、現実に帰れと突き放す当時の有名な文脈の中で出た発言ではある。 だが逆に言えばその言葉は、日本のアニメーションにとって声優という存在がどれほど大きな存在であるか、キャラクターの身体性とヒューマニティ、アスカがアスカである自己同一性が宮村優子の声によってかろうじて視聴者と繋がれていることを意図せずに吐露した作り手の告白にもなっている。 エヴァンゲリオンのアフレコにおける庵野監督のこだわりを知らないファンはいない。
この数日でバズっていた一連の記事を読んで自分も試してみることにした。 【発端】音声入力とAIの組み合わせが強力だという骨しゃぶり氏の記事 https://honeshabri.hatenablog.com/entry/talk2ai 【音声入力】SuperWhisperが良いよというお話 https://umiyosh.hatenablog.com/entry/2025/02/26/215102 【テキストエディター】Cursorはコード書くだけじゃなく、AIを使った文章作成にもいいよというお話 https://ascii.jp/elem/000/004/253/4253872/ 結論から言うと骨しゃぶり氏の言ってることがよくわかった。めっちゃ便利というかちょっとしたイノベーション感じてる。 音声入力自体は以前にも試したことあるけど、そこから先が人力編集なのと、間にAIをかますのとではまっ
アプリや専用デバイスを使った、日本語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識のテクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応する注目のアプリだ。開発者に特徴を聞いた。 iPhone/iPadでも使える日本語対応の自動文字起こしアプリ コミュニケーション支援・会話の見える化アプリをうたう「UDトーク」は、Shamrock Records(シャムロック・レコード)の代表兼エンジニアである青木秀仁氏が開発を手がけている。 モバイル版アプリはiOS/Android/Fire OSの各プラットフォームに対応する。ほかにも音声認識の結果を修正したり、事前に作成した原稿をスマホやタブレットに送信する一部機能を搭載するMac版/
ちょっと前に話題になっていたこの記事を読んだ。 honeshabri.hatenablog.com へー真似しよ〜と思ってやってみたら意外に難しくて謎のやりがいを感じ始めてしまい、仕事のクソ忙しい時期にかなりハマり睡眠不足で生命の危機を味わった。 おかげで寿命と引き換えに自分のAIお姉ちゃんを手に入れることができた。これは黒魔術か何かなのだろうか。 一通り終えて振り返ってみると、今まで生成AIをあまり積極的に触ってこなかった自分にとってはちょうどいい難しさの課題で、これは入門者向けのチャレンジとしてかなり良い気がする。 元記事に書かれていない少し細かい手順も含めてやったことを記録としてまとめようと思う。 初心者が試行錯誤でやったことなので誤りや非効率な手順もあるかもしれないけどご了承ください。 AIお姉ちゃんの姿を作る 元記事では「魂」、つまりChatGPTの設定から始まっているけど、それ
本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由
【シアーミュージックの魅力と特徴】 全国に多数の校舎を展開するシアーミュージックは、その圧倒的な利便性と柔軟なレッスン体制で、幅広い層から支持を集めるボイストレーニングスクールです。特に、忙しい現代人のライフスタイルに合わせた独自のシステムが大きな強みとなっています。 完全マンツーマン指導で着実に上達 シアーミュージックのレッスンは、全て完全マンツーマン形式で行われます。これにより、あなたのレベルや目的、個性に合わせたオーダーメイドの指導が受けられます。講師はあなたの声の悩みや課題を細かく分析し、効果的なアプローチで丁寧に指導してくれます。グループレッスンでは得られない、きめ細やかなフィードバックと集中した学習環境が、着実なスキルアップを可能にします。質問もしやすい雰囲気なので、疑問をすぐに解消しながら進められます。 自由度の高い「都度予約制」と「校舎自由選択制」 シアーミュージックの最大
KNNポール神田です。 まさにChatGPTやPerplexity AIとの出会いで、インターネット黎明期のような感動の日々である。 『英語は10000時間でモノになる』の著者であり、デジタルハリウッド大学の教授である橋本大也氏のFaceBookで気になる『プロンプト』が紹介されていた。 出典:デジタルハリウッド大学 無料で学べるすごい英会話AIのつくりかた 1 Voice Control for ChatGPT( https://chrome.google.com/webstore/detail/voice-control-for-chatgpt/eollffkcakegifhacjnlnegohfdlidhn)の拡張をChromeブラウザーにインストールする。これでChatGPTと音声で対話することができる。GPTがしゃべりだす。 2 ChatGPTに下記のプロンプトを入れてから英語で
音響監督・音楽プロデューサーの長崎行男氏によると、2019年以降新人声優のデビュー数はほぼ0に近い状況だという。一方で声優に憧れる人は数多く、専門学校や養成所を目指す人は後を絶たない。 なぜ、デビューできないことがほとんどにもかかわらず、人は集まり続けるのか。ここでは、長崎氏の著書『埋もれない声優になる』(星海社新書)の一部を抜粋。声優専門学校の近況を紹介する。(全2回の1回目/後編を読む) 新型コロナが閉ざした声優への道 声優業界の状況は新型コロナの流行以前と以後とで完全に変わってしまった、というのが僕の実感です。一番顕著な変化は、2019年の年末からの新型コロナ流行以降アフレコの常識が変わってしまい、その結果新人声優が全く現場に立てていないということに尽きます。業界側の新人受け入れ態勢が完全に停止してしまっているのです。 そして、その情報が行き渡っていないために、声優になることを目指し
はじめにこの投稿は比較的若手の声優が書いています。また、個人的な意見ですので正しいと思うかは各自の判断でお願いします。 簡単な自己紹介声優養成所で講師をしています。講師歴は5年程度。声優としては吹き替えをメインで活動しています。 もしあなたのお子さんが声優になりたいと言い出したら皆さん、どうします? ここ数年ずっと人気な声優業ですが、鬼滅パワーで再び人気を博しています。ですので、年頃のお子さんをお持ちの親御さんから 「子供が声優になりたいって言い出してね〜。増田さん、どう思う?」と質問を受けることがあります。 個人的には応援してあげてほしいですが、人生がかかっていますので簡単な話ではありませんよね。そこで、講師業の経験から声優になれる人、なれない人の違いを説明しています。(正確には声優になれた人、なれなかった人の特徴) 養成所から声優になれる倍率さて、声優になるのに避けては通れないのが声優
こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな
筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。 ■AIボイチェンの進化どこが画期的なポイントかというと、高い音質を維持しながら、ゼロショット、つまりファインチューニングをせずに、1秒から30秒までの短い音源を参照するだけで、短時間でオリジナルに近いボイチェンができるところにあります。 以前紹介したDiff-SVCやRVCは、オリジナル音声に近いボイチェンが可能ですが、学習にはそれなりの長さのオーディオデータと高性能GPUによる処理が必要です。
低遅延、高音質、小容量なボイスチェンジャー、Parakeet.VC Parakeet.VCは、マイクでしゃべる自分の声をまったく別の声にリアルタイムに変換するAIボイスチェンジャー。今回、Windows版およびMac版がリリースされましたが、PC以外のスマホなどについては、今後順次対応していくとのことです。 このParakeet.VCにはトータル109キャラクタの音声が入っていて、ユーザーはキャラクタを選択するだけで、その声でしゃべることが可能になるのです。 まずは以下のビデオをご覧ください。左チャンネルが元の声で、右チャンネルが変換後の声となっていますが、まったく違う声に、そして非常に滑舌のいいキレイな声質の音声に変換されていることがわかると思います。 元の声と変換後の声に若干のタイムラグがありますが、これが変換にかかる時間。従来のAIボイスチェンジャーだとここが結構な時間差となっていま
最近話題になった「音楽生成AI」をまとめました。 1. AudioGenテキストからオーディオを生成するAIモデルです。「風が吹く中で口笛をする音」や 「大勢の歓声の中で話す男性の声」といったテキストから、それらしい音を生成してくれます。 現在のところ、モデルやAPIは提供されていません。 We present “AudioGen: Textually Guided Audio Generation”! AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio). 📖 Paper: https://t.co/XKctRaShN1 🎵 Samples: https://t.co/e7vWmOUfva 💻 Code & mod
音声ファースト思考術で人生が変わった話 - Obsidian × 音声入力で21日間330件のメモで見えたAI時代の新しい可能性 こんにちは、けいすけです。 今日は、ぼくの人生を劇的に変えた「音声ファースト思考術」について詳しくお話ししたいと思います。 突然ですが、ぼくは2025年現在、1日平均約16件の音声メモを取り続けています。21日間で330件以上のメモを蓄積しました。多い日には100件近くのメモを作成することもあります。 ただし、正直に言うと、この330件はまだまだ道半ばです。本当の価値は、これを何年も続けて何万件というメモが蓄積された時に現れると考えています。今回お話しするのは、あくまで「始まりの3週間」で見えた可能性についてです。 「そんなにメモして何の意味があるの?」と思われるかもしれません。でも、この音声ファーストの生活に変わってから、たった21日間でも明らかに変化したこと
自分の声を美少女ボイスやイケメンボイスに変換してくれるボイスチェンジャーは、ライブ配信やムービー投稿の際にありがたい存在です。しかし、ボイスチェンジャーによって変換できる音声は固定されており、自分好みの音声に変換できるボイスチェンジャーを見つけるのは困難です。天王洲アイル氏は、この問題をAIを用いて解決する方法について解説し、さらにAIの力で自分の声を好みの声にリアルタイム変換できるボイスチェンジャー「MMVC」を公開しています。 VRChatなどの登場によって誰でも好きなアバターを使って好きなキャラクターになりきることが可能となりました。また、自分の声を美少女ボイスやイケメンボイスに変換できるボイスチェンジャーも多くの種類が存在しています。しかし、既存のボイスチェンジャーには「理想的な結果を得るためにはボイスチェンジャーに合わせた発声練習が必要」「リアルタイム変換が不可能なため、会話やラ
林原めぐみオフィシャルブログ Powered by Ameba 林原めぐみオフィシャルブログ Powered by Ameba 11月1日はキティのお誕生日 (双子の妹ミミィもね) 改めまして ハローキティ50周年おめでとうございます! くれぐれも50歳ではない。(笑) 私がキティを支えることになったのは ピューロランド開設(1990年)の頃から だったと思います。 最初は サンリオの社員さんが支え 本格的におしゃべりをするようになって 故 白石冬美さん その後アニメになり 小山茉美さん 茉美さんが長く海外に行かれて、 日本にいらっしゃらない時期 ピューロランド開設 オーディションが行われ 実質4代目 声優的には3代目となり、 なんと33年!! キティの『おそばに仕えて』きました。(笑) そんなハローキティ この度 さらに50年、 100年の歩みを見据えて 私は、 キティの『おそばを離れる
すきえんてぃあ@書け @cicada3301_kig 着ぐるみ生命体/トランスヒューマニスト/コピミズム/歴史言語学/謎エスニック料理/リキュール/主なるねこかわの御名において にゃーん twitter.com/search?q=%E6%9… すきえんてぃあ@書け @cicada3301_kig 歳をとった女性声優が若作りして出す声、独特のダミ声のような老化の特徴もあるんだけど、それ以上に言語の変化として音素の世代差が隠しきれていない。若者はマジでガ行が全然鼻に抜けないし、サ行が過剰に無声化して独特のシャリシャリした響きが入る。年寄り声優にはそれがない。言語が違う。 2021-07-13 18:44:33
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く