オープンソース VOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
ここ数年、日本のシティ・ポップの海外人気が続いている。竹内まりや「Plastic Love」の再評価に端を発し、山下達郎や大貫妙子などの日本のポップスの名曲が世界各国の若い音楽ファンに受け入れられている。そんな話題を耳にしたことのある人もいるだろう。 が、コロナ禍以降の大きく変動する音楽シーンの中で、シティ・ポップのリバイバル・ブームも以前とは違う様相を呈するようになってきている。 少し前だったら「都内のレコードショップで70年代や80年代のアナログ盤を買い求める外国人観光客」の姿がブームの象徴として取り上げられることも多かった。しかし、今はTikTokで若い世代に発見された楽曲がSpotifyのバイラルチャートを駆け上がり、新たなアンセムとしてストリーミングサービスで人気を呼ぶ現象が生まれているのである。 その代表が、松原みきのデビュー曲「真夜中のドア〜stay with me」だ。19
しばらく来ない間にはてなからずいぶんと人が減った気がする。ブクマとかの勢いとか、更新されてるサイトとか、なんか、雰囲気とか、そういうなんとなくの感覚だけれども。あと、自分もそんなこと言いながらはてなとかインターネットからいなくなってたんだけれども。 リアルの生活が忙しい(忙しいのでいろいろインプットする時間がない)(アウトプットする時間もない)というのと、一度書かなくなると、文章筋が衰えて、文章が書けなくなるっていうのがあって、まあ、ずいぶんと更新も、Twitter投稿とかも、間が空いてしまってましたね。 書こうと思ったら書いたり話したりできることもあるけれども、ちょっと考えてるうちに「まあいいか」って思ってしまったり、なんというか、いろいろなことに疲れてたっていうのが、まあ、実際のところだと思います。 で、最近ちょっとマシになってきたので、ちょっと801ちゃんの漫画を描いたりとかしてます
前エントリが思いの他読んで貰えて「まぁ、こんなものか」と思っていた20数年の枯れたプログラマ人生に幾許かの水を挿して貰った気分になった。ありがとう。 続きを書いて欲しいという声もちらほら頂いたので調子にのって書いてみた。 ↓前エントリ https://anond.hatelabo.jp/20210130001953 年収が高いのでは?という声をそれなりに頂いた。 最初に所属した会社が倒産をして先輩の起業に付いていったのだが、その会社が完全歩合制の会社だった為、多重派遣としては良い方の収入だったように思う。 例えば、月単価から2割が会社のお金、8割が自分の取り分というようなシステムである。勿論、仕事が無い時は収入はゼロ。 前エントリでも書いたが、個人でフリーでいるより単価交渉をしやすく、将来貰えるかは解らないが年金も2階建てに出来る。 現状ではある程度キャリアのある人達にとっては悪くないシス
あなたに「うっせぇわ」を理解しているとは言わせない誰も本音を語らない時代。少なくとも、ある人にとってはそうだ。 その人は、被害者意識にも加害者意識にも苛まれることはなく、そうと言われないまま否定される―― この書き出しで、読むのがしんどそうだと思った方もいるかもしれない。本記事のテーマは、YouTubeで脅威の8500万(3月3日現在)再生を誇る注目の楽曲、Ado「うっせぇわ」の分析である。 この曲の存在を知らない「年上世代」も含めた全世代の読者に伝わるように、との依頼だったので、その意に添うべく、現在の日本の平均年齢である47歳の読者を想定し、親切に書きたいと思う。けれども筆者がこの曲を誠実に分析しようとすればするほど、この曲が「年上世代に聴かれようとしていない」ことを明らかにしてしまうだろう。 「うっせぇわ」は、2020年代の若者の本音そのものである。そしてそれは、年上世代が本来触れる
本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由
(8/26 いろいろ加筆修正しました。) (8/27 情報を頂いたのでブラジリアンミクブームの発端についてもう少し詳しい説明を書きました。) (9/2 さらにミクさんを追加。一番下にまとめてあります) ブラジリアンミク、誕生の経緯・ブラジル人のアーティストでありインフルエンサー、「Tuzera」氏が初音ミクを使用した楽曲「Himitsu da yo」を発表 「Himitsu da yo」 @tuzeraofc I’ve made brazillian funk with Hatsune Miku. Name of the song: “himitsu da yo - tuzera” #vocaloid #music #hatsunemiku #vocaloidmiku #miku #vocaloidcosplay ♬ Himitsu da yo (feat. Hatsune Miku) -
低遅延、高音質、小容量なボイスチェンジャー、Parakeet.VC Parakeet.VCは、マイクでしゃべる自分の声をまったく別の声にリアルタイムに変換するAIボイスチェンジャー。今回、Windows版およびMac版がリリースされましたが、PC以外のスマホなどについては、今後順次対応していくとのことです。 このParakeet.VCにはトータル109キャラクタの音声が入っていて、ユーザーはキャラクタを選択するだけで、その声でしゃべることが可能になるのです。 まずは以下のビデオをご覧ください。左チャンネルが元の声で、右チャンネルが変換後の声となっていますが、まったく違う声に、そして非常に滑舌のいいキレイな声質の音声に変換されていることがわかると思います。 元の声と変換後の声に若干のタイムラグがありますが、これが変換にかかる時間。従来のAIボイスチェンジャーだとここが結構な時間差となっていま
Adoさんが2023年7月10日放送のニッポン放送『Adoのオールナイトニッポン』の中で自身が歌い手となるまでの道のりをトーク。小学校1年生でネットやボカロと出会ってから、ネットに作品を発表して歌い手になるまでを話していました。 (Ado)まあ、そんな私は歌い手として活動してるんですが。「歌い手」っていうのは、いわゆる、なんですかね? 歌手とはまた違う、私が名義してる歌い手っていうのはボカロの曲をカバーして投稿させていただいているっていう、いわゆるネット文化から生まれた、ネット文化の歌い手っていう存在でやらせていただいてるんですが。私はね、本当に子供の頃……小学生の時はもうずっと、ネットズブズブで。そもそものネットのスタートも、何歳ぐらいだっけな? 私、割と早いんですよ。小1。だからもう、すごいよね。自分で言っておいて。すごくない? だからあれだよ。6、7歳。ぐらい。もうエリートでございま
これまでに誰でも簡単に「結月ゆかり」の声になれる音声変換技術や音声合成ソフト「VOICEVOX」を開発してきたヒホ氏の所属するドワンゴの機械学習技術研究部門Dwango Media VillageがAI音声合成ソフト「Seiren Voice」を発表しました。Seiren Voiceではマイクで録音した音声を自動で文字起こしして、イントネーションを再現したまま結月ゆかりや琴葉 茜・葵のボイスに変換可能とのことなので、実際に無料体験版をインストールして使い方や変換精度を確かめてみました。 高品質な音声変換ソフトウェア | Seiren Voice https://seiren-voice.dmv.nico/ ・目次 ◆1:Seiren Voice&音声ライブラリのインストール手順 ◆2:Seiren Voiceで音声を変換する手順 ◆3:Seiren Voiceで編集部員の声を結月ゆかりにボ
10月27日、Synthesizer Vの新しい歌声データベースとして、Maiがお披露目となり、その歌唱動画が公開されました。実際にユーザーが入手可能になるまでには、まだもう少し待つ必要がありそうですが、遅くとも年内には登場するそうですから心待ちにしたいところです。 今回、Synthesizer Vの開発元であるDreamtonicsによって公開されたMaiの歌声のビデオを見ると、驚くほど滑らか、スマートな歌い方であり、もはや人間の歌声と区別がつかない次元まで進化しているように感じます。しかも、とくに調声をしなくても、音符と歌詞を入力するだけで、非常にリアルな歌い方をしてくれる、というのも、嬉しいところです。一方で、先日リリースされたSynthesizer V Studio Proの最新バージョン1.7.1において、歌声データベースの複数バージョンを利用できる機能が追加されています。なぜそ
AI歌声合成技術の開発を手掛けるテクノスピーチ(名古屋市)は2月18日、AI技術により人間らしい歌声を合成できるソフトウェア「CeVIO Pro」のα版を24日に無償公開すると発表した。既存バージョンの「CeVIO」「CeVIO AI」とは異なり、Windows・macOSの両方に対応。追加の許諾や利用料不要で商用利用も可能。 CeVIO Proは、楽譜と歌詞を入力すると、AIが人間らしい歌声をシミュレーションして出力する歌声合成ソフト。まずは無料で商用利用もできるキャラクター音源1種類と編集ソフトをα版としてリリース。当該音源は正式版のリリース後も無償提供する。 現在の最新版であるCeVIO AIは、Windows専用で音楽制作ソフト(DAW)との連携に未対応。販売方法も買い切り方式だが、CeVIO ProはmacOSにも対応し、DAWとの連携も可能。第2弾以降のキャラクター音源はサブス
米津さんが主題歌を担当されると聞いた時、つるまさんはどう思われましたか? だいぶ昔の思い出話になってしまうんですけど、私は昔ボーカロイド楽曲にハマっていて、その時に初めてハチさんのことを知ったんです。初めて聴いたのは「Persona Alice」です。当時「週刊VOCALOIDランキング」というものがありまして……それをきっかけにハチさんのファンになりました。 非常に懐かしい話ですね。 思春期の頃、周りの人があまり知らない“自分だけのもの”を好きでいたいという思いがあって。ハチさんの楽曲を好きでいることが、自分の不安定なアイデンティティを形作るひとつの要素になってくれていたんです。 大人になった今も、当時の不安定な自分のことも大切に思っているし、その頃の感覚を忘れないためにも、米津さんの曲は新曲が出る度に欠かさず聴いていました。だから、アニメになるだけでも念願が叶った気持ちなのに、さらに米
穏やかな人生 @haru_yuki_i YOASOBIほんと好きなんだけどこれを“今の音楽”として捉えてはならない気がする、YOASOBIは“今の音楽”ではなく、10年くらい前に時間停止したオタクの“あの頃の続き”的なやつなんだ、現在進行形の音楽の中で抜きん出てオタクの耳に優し過ぎて気を抜くと「“今の音楽”もいいじゃん!」と勘違いしそうになる 2021-01-06 10:50:30 穏やかな人生 @haru_yuki_i YOASOBI、おっさんが頑張りを出さなくても普通に聴いていいんですよね、なんかもう普通にめちゃめちゃいい、気が付くと無限に聴いてる、“今の音楽”への認知が歪む、危険です、ちゃんとNiziUとかも聴かないとヤバい、YOASOBIの優しさに甘えてはならない 2021-01-06 10:58:35 穏やかな人生 @haru_yuki_i ほんとに危険なんですよYOASOBIの
筆者は20代半ば、いつになったら名実共に大人になれるかと思案したりはするものの、まかり間違っても子供を名乗れるような歳ではない。 うっせぇわ/Ado https://youtu.be/Qp3b-RXtz4w Adoの勢いは止まることなく、17歳最後の日である10月23日、メジャーデビュー曲「うっせぇわ」を発表。楽曲を手がけたのは、Adoがカバーしていた「邪魔」、「馬鹿」などでも知られる、2020年最も躍進したボーカロイドプロデューサー・syudou。Adoはハイテンションかつナイフのように尖りまくったボーカリゼーションによって、毒っ気ある低音から耳を突き刺すハイトーンまで歌声を自在に使い分け、鬼気迫る迫力で圧巻の歌唱を聴かせてくれた。意外にもチェッカーズやPsysalia Psysalis Psycheを彷彿とさせる隠れキャラのようなフレーズを忍ばせる言葉遊びの妙。ど頭から内に秘めた思いを
驚異的に進化したSynthesizer V AI まずは、バックグラウンドや機能、性能といったものを紹介する前に、私がSynthesizer V Pro Studioの1.5.0を使って打ち込んだ、弦巻マキの歌声をちょっと聴いてみてください。 いかがですか?従来の歌声合成の概念を覆すレベルに来ていると思いませんか?これは、2年前のコミケでDTMステーションCreativeからリリースしたoyasumiという曲の冒頭部分。そのときは声優の小岩井ことりさんにボーカルをお願いし、囁くように優しく歌ってもらったので、弦巻マキにも、それっぽく歌わせて仕上げてみたのです。本来、弦巻マキは「アニメキャラっぽい雰囲気の元気な女の子」というイメージの歌声ですが、そことはだいぶ違ったニュアンスの歌声になっているのも感じられたと思います。 「自動処理」メニューにある「自動ピッチ調整(カスタマイズ)」を選択する
御丹宮くるみ@バーチャルボカロリスナー🍖🎶 @oniku_kurumi 隙自語だけど、小学生のころ母親に好きなボカロ曲を聴かせたときは「ここの転調でミクの声のポルタメントが元のキーに残ってるのがきしょくて嫌」とか「このドラムフレーズはドラムセット3つ無いと成り立たない、そういうのはママはあんまり聞かない」とか言われた記憶がある。のを思い出しました 2023-06-13 20:35:22 御丹宮くるみ@バーチャルボカロリスナー🍖🎶 @oniku_kurumi ドラムフレーズについては一緒にいた父親が「プログレッシブロックであればドラムセット複数用意するパターンやキーボード複数用意する超絶技巧もよくある。そういうのだと思えばいけないか?」みたいな援護射撃をしていた記憶もあり、今思うと恵まれたオタク家庭だな… 2023-06-13 20:54:55
毎年ニコニコ動画で開催されているアイマス楽曲大賞、投票者層がニコニコユーザーに限られるため非参加者からは偶に色々言われる企画なのですが、私はファンメイドな企画が大好きなのと折角やるなら参加者数を増やしたほうが投票結果も面白くなる!ってことで例年は積極参加して広告にブログで宣伝を書いたりしていました。 ですが……今年は忙しかったというのも確かにあるのですが、適当に投票するに留めて参加を呼びかける記事も書かず、本日投稿された結果動画もスキップして結果だけ見る始末。アイドルマスターが、辛いのです。 1,シャイニーカラーズ シャイニーカラーズはサービス開始当初からプレイしており、グレード7に達したり、1stライブから現地参加してリリースイベントにも参加するぐらいにはのめり込んでいました。 しかし2021年12月に新たな月額課金コンテンツが実装され月額3000円の寄付をせねばグレードフェスへの参加の
小学校2年生のころからプログラミングを始めた --Synthesizer Vの話に入る前、Kanruさんの子供時代について伺いたいのですが、最初のコンピュータに興味を持ったのはいつごろだったのですか? Kanru:3歳のころ、父からもらったおもちゃで電気の仕組みに興味を持つようになり、小学校に入ったころからラジオ作りなどをしていました。コンピュータもラジオ作りと同じころで、小学校2年生のころにAdobe(当時はMacromedia)のFLASHを使ってプログラムを組むようになったのが最初です。友達がみんなゲームで遊んでいたのに、親が厳しかったので、ゲームはダメと言われていました。そこで、FLASHを使ってクラスメイトが持っているゲームを真似して作ってみたのです。親も自分が作るゲームならいい、と。 Profile Kanru Hua(華 侃如) ●1997年生まれ・中国上海市出身。英語で授業
初音ミク、誰も予想できなかった文化の誕生〜奇跡の3カ月(序) パソコンソフトが世界的知名度を得た軌跡 丹治吉順 朝日新聞記者 2007年晩夏に登場したときは、箱に入った1枚のCD-ROM、それに収められたパソコン用ソフトにすぎなかった。 パソコンにインストールして使う。その点で、家電量販店やパソコンショップで買えるワープロや表計算ソフト、年賀状印刷ソフトなどと変わりない。 「初音ミク」と名づけられたそのソフトは今、日本国内はもとより、世界中の都市を巡るコンサートを毎年のように開いている。 例えば2018年夏〜冬には、ロサンゼルス、ニューヨーク、ワシントンDC、パリ、ロンドン、ケルン、北京、上海など13都市、さらに翌2019年春と夏には台北や香港でもコンサートを開いた。2020年には世界最大規模の野外フェスティバル・米コーチェラへの出演のほか、ボストン、シカゴ、モントリオールなどを巡る北米大
集英社週刊プレイボーイ編集部が企画して出版したものの引っ込めてしまったAIグラビアアイドルさつきあい写真集「生まれたて。」をめぐっていくつか興味深い記事が上がっています(清水亮さんのコラム、新清士さんのコラム)。 既存のAIモデルだけではなく、さらにファインチューニングで使われたかもしれない実在の女性タレントをめぐる論考ですが、実のところは肝心の編集部が多くを語っていないため不明。 これとは別に、いくつかの画像投稿サイトではAIを使った「写真」「イラスト」の投稿を禁止するところも出てきており、大手サイトでの例外はAmazon.co.jpだけという話になっている一方、著名タレントのLoRA(学習されたAIモデル)のファイルが配布されていたりと、実在の人々の権利を脅かすのではないかと当初懸念されていた問題も顕在化しています。 筆者も実在の人物(妻)の写真をAIに学習させて、それを「異世界とりち
すでに、その歌声を聴いて驚かれた方も多いと思いますが、本日10月30日、株式会社インターネットより、「Synthesizer V AI 花響 琴(Hibiki Koto)」が発売されました。非常に人間らしくリアルに歌うAI歌声合成エンジンとして広く知られるSynthesizer V AIではありますが、花響 琴はその中でも最高レベルの歌唱力を持つと同時に、幅広い表現力を持った歌声データベースになっており、従来の歌声合成の世界観とは一線を画すこれまでにない歌声を実現するものとなっています。 まさに圧倒的な歌唱力の本格派シンガーであるデフォルトのボーカルスタイルに加え、優しく歌うBallade、かわいい声で歌うCute、暗い声で歌うDark、ミュージカル風に歌うMusical、Falsetto(ファルセット)、パワフルに歌うPowerと、さまざまな歌い方ができるのも花響 琴の大きな特徴。そして
昨日投稿した記事がとてもありがたいことに伸びたので、調子に乗って別の話をしようと思う。軽い気持ちで書いてたらクソ長くなった。 これを読む前に注意してほしいのは ・これはアニメ「推しの子」を見た感想だということ(漫画ではない)・ネタバレが含まれること・全部俺の主観的な意見にすぎないことだ。 え、「アイドル」神曲やんYOASOBIの「アイドル」を聞いて、これはすごいと思って推しの子を見た。 そして第一話でアイが殺されて「??????」となった。あまりにも納得がいかなかった。それは以下のような理由による。 第一話、そして主題歌「アイドル」で提示されたこの作品のテーマ性について偶像としてのIdolを死守する(「嘘が愛」とかアイっていう名前からも推察できるように)というのが最序盤のテーマだったわけで、そこに子供がいるっていう嘘を死守するっていう物語があって、さらにIdolとしてファンを愛してるってい
初音ミクなどバーチャルシンガーを好む層の中では話題となっているのだけれど、2022年3月1日にCASIOからカシオトーンブランドの新製品「CASIO CT-S1000V」が発売開始となったけれど、このCT-S1000Vが最高なので語ってしまいたいと思う。 「カシオトーン?電子キーボードの?よく家電量販店に売ってるアレ?」と反応してくれる人は流石だ。 その通りで「家電量販店に並んでる電子キーボードでネコ踏んじゃったを弾いた。それはたまたまカシオトーンだった」なんていう経験を持ってる人は少なくはないと思うけれど、CT-S1000Vはそのカシオトーンブランドの新製品だ。 「電子キーボードなんて興味ないし」というそこのアナタ、実を言うと筆者は電子キーボードのみが好きというわけでなく様々なガジェットを愛するガジェットマニアなんだ。 筆者は単に電子キーボードをパソコンやスマホ、カメラなどに並ぶものとし
このDiff-SVCを簡単に実行できるGoogle ColabのNotebookが1月23日に公開停止となってしまったのです。ですので、前回紹介したやり方での実行はできなくなります。筆者はGoogle Colabからローカルにコピーしているのでこれまで通りに使えますが、新規に手軽にやろうという人への道は一時的にではありますが、閉ざされたことになります。 ▲筆者はGoogle ColabのNotebookをローカルに保存しているので現在も利用可能 なぜこういうことになったかというと、それは悪質な利用者のせいです。 自分の音源や、権利を所有する、許可をもらっている人物の声であれば問題ないのですが、前回言及したように、よく知られている歌手、セレブ、VOCALOIDなど既存のバーチャルシンガーの音源などを勝手にDiff-SVCでAI音源にし、歌わせたものを例えば「AIアリアナ・グランデが~を歌った
「ボカロ」というジャンルの現在を総括する評論同人誌『ボーカロイド文化の現在地』の主宰・highlandさんが選ぶ、2023年のボカロ名曲15選──。 2023年に入ってますます盛り上がりを見せているVOCALOID(以下、ボカロ)シーン。 その熱狂は多かれ少なかれコミュニティ外にも認知されていると思うが、一方で「今のボカロに興味はあるけど何から聴けばいいのか分からない」と感じている方も多いことだろう。 今回は2023年に発表されたボカロ曲の中から、ボカロを知らない人にも届くような力をもつポップな名曲を15曲ピックアップした。 少しでも気になる曲があればぜひ聴いてみてほしい。 執筆:highland目次 1. 強風オールバック(歌愛ユキ)/ Yukopi2. 人マニア(重音テト)/原口沙輔3. 花に風(初音ミク)/バルーン4. マザーデイズ(可不)/Chinozo5. ザムザ(初音ミク)/て
音声合成ソフトの開発と販売を手掛けるAHS(東京都台東区)は2月17日、AI技術により人間らしいトーク音声を合成できるソフトウェア「VOICEPEAK 商用可能 6ナレーターセット」を3月11日に発売すると発表した。価格は1万5800円からと安価だが、追加の許諾を得なくても商用利用できる。対応OSはWindows、MacOS、Linux。 音声合成エンジンは、AI歌声合成ソフト「Synthesizer V」を開発したDreamtonics(東京都台東区)が開発。文章を入力すると、AIが文脈などを基に人間らしく読み上げる。イントネーションや読み上げ速度、感情表現の変更などのコントロールも可能。 同社製の個人向け・商用利用ライセンス別売の製品は1キャラクターで1万円前後のものが多いが、本ソフトには男性3種類、女性3種類、女の子1種類の計7音源が付属。価格は初回限定版が1万5800円、割引なしの
「隣のクラスタも楽しそうだけれど、これまでの経緯がわからないのでイマイチ手を出しづらい……」そんな人たちに贈る新連載! 初回は、コロナ禍で爆発的な盛り上がりを見せている界隈の歴史について前後編でお送りします 〈後編はこちら〉 隣のオタクは何する人ぞ―― 近年、同好の士と話をしても、界隈(クラスタ)が異なると、話題の共有が難しいことに気がついた。 ある友人は光る棒を振り、別の友人はVRゴーグルを被っている。VTuberにASMR、ライブに2.5次元舞台……。様々なコンテンツが発達したおかげで、私たちは楽しいオタクライフを過ごせているが、一方で、知るものと知らないものの差が大きくなり、“知識の分断”も起きている。 本連載では、毎回1つの界隈にフォーカスし、現在の盛り上がりに至るまでの経緯も含めてキーマンに伺うことで、知識の共有を図れればと思う。 今最も熱い職業は「3DCGキャラの中の人」 人間
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く