Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
[B! AI] DeepSeek狂奏曲
[go: Go Back, main page]

記事へのコメント68

  • 注目コメント
  • 新着コメント
rawwell
“筆者もDeepSeek-R1の1.58ビット量子化モデルを試してみたが、その性能に舌を巻いた。 もちろんフルスペックのDeepSeek-R1よりも精度はかなり落ちるが、完全にローカル環境で、今でも二千万円くらいの予算があれば構築できる

その他
soyokazeZZ
“生成AI業界にとっての1年は、通常のテクノロジーにおける10年に相当する時間差がある”ほんこれ。10年間得られたはずの利益が1年で終わってしまう

その他
raitu
“多くの会社がOpenAIを著作権侵害で訴えているが、著作権侵害の可能性があるデータで学習して有償サービスを提供しているOpenAIはDeepSeekを訴えることができるのか。”

その他
unmarshal
GPUの期待過剰だったバブルが弾けるのはそうだと思うけど、引き続き学習もマシンのスペックも重要なのは変わらないと思う。

その他
dpdp
“生成AIに大金を投じても、それがオープンアクセスなものである限り、一夜にして価値を失うリスクを持つ“”この点に関しては、NTTやNECがとっているような、「クローズドLLM戦略」の方が正しい。みすぼらしいが”

その他
s_nagano
s_nagano “これからは学習ではなく推論が遥かに重要。推論が重要な時代には必要なプロセッサはもはや(どう考えても)GPUではない。 SambaNovaのようなデータフロープロセッサや、GroqのようなLLM専用推論エンジンの必要性が増える。

2025/01/31 リンク

その他
natu3kan
一度、作ってしまえばCUDAやnVIDIAの高いGPUなくても研究できるってなるとnVIDIA一強から変わってくるよな。大量に密輸されてるであろうH100などのnVIDIAの高性能GPUで作られた疑惑はあるにせよ。

その他
takeishi
実をいうと、GPUの時代は終わりです。突然こんなこと言ってごめんね、くらい言って煽ってもいいのに

その他
qinmu
清水亮氏。

その他
Cru
ln(3)/ln(2)=1.5849…bitね。1,0,-1の3値量子化。これでLLMが高性能化するのは間違いないが所詮は高度な回帰機械に過ぎず、株式予測などには使えないし、ハルシネーションは不可避。省力化方面にしか使えない

その他
mohno
著作物を学習するな、嫌だ、といっても、ガンガンスクレイピングしていくくせに、うちのモデルを再利用するなっていうの、なんだか皮肉だよね。/さっさとAI出力をフィルタリングできるように規制しろ。

その他
blueboy
蒸留でデータを得たというのは眉唾だね。AIの情報はネット全体の情報をいちいち検索することで得られている。大量のWeb情報を処理する情報処理能力が大事であり、そのためには蒸留機能は無関係だ。だまされている。

その他
kyukyunyorituryo
安いAIキットができたらプログラムを組んで遊びたい

その他
gamecome
無断で学習つっても、普段僕らが本読む時に著作者に「ちょっと学ばせて頂きますね」とか言わないと思うのだが。作られない内は現行法に従うべきでは。学習で言ったら、openAIは学習用の加工のコストも担っているのだし

その他
yarumato
“DeepSeek-V3/R1など、オープンウェイトで公開されたモデルは、蒸留や量子化で高速化/低容量化てきる。特にDeepSeek-R1の1.58ビット量子化は本来VRAM80GBx8基x二台をVRAM80GBx2基(2000万円)で動作可能。量子化とは。蒸留とは。”

その他
green_chili
green_chili 「DeepSeekがOpenAIの百聞の1規模の予算で同等の性能のAIを作れたのはある意味当然で、それは蒸留にいかにコストがかからないかを示している 」 「AIが生成したデータには著作権は認められない⋯今や世界的コンセンサス」

2025/01/30 リンク

その他
tyosuke2011
まだ画像生成とか添付ファイルとか動画作成が出来てないから今後に期待

その他
michael-unltd
“「量子化」と「蒸留」は違う。「量子化」は計算精度を変えるということで、「蒸留」はあとで説明するが、「異なるモデルに再学習する」ということだ。量子化でも蒸留でも精度が劣化する可能性は高まるが、今回の1.5

その他
kazu111
EV市場より簡易に参加できるAI蒸留市場、利益独占のはずだった既存米中大手株価総崩れ。なろう小説みたいなザマァ展開⇒米中AI大手に追放された絵師が、AI蒸留で超大手を簡単撃破、俺やっちゃいました的な展開も可能に

その他
poko78
蒸留

その他
T-norf
雑と分かるところも多いけど、「1.58ビット量子化」「推論が重要な時代には、必要なプロセッサはもはや(どう考えても)GPUではない」が私には判断つかない。学習需要は明瞭に減るし、これ正しければNVIDIA株価は爆死かな

その他
star_123
“例えば論理回路上にハードコードされた重みなどで威力を発揮するだろう。それはより低消費電力で、ボタン電池で動作し、生活のありとあらゆるところに入り込む” この話はめちゃ面白いな

その他
zyzy
OpenAIがお行儀悪すぎたんだよな、そもそも。同じ事やりかえしても論文公開してOWにしてるだけDeepSeekはまだお行儀がマシという

その他
augsUK
OpenAIこそ何も公開してないので学習したデータ元も重みも不明だから、そこの蒸留を規制しても実効性を持たせるべきかも不明。GPTはまだまだ性能が上がっては欲しいのだが。

その他
kitone
大向先生

その他
sjn
“AIが生成したデータには、著作権は認められない。これは今や世界的コンセンサスになりつつある。そもそも〜”日本人科学者も蒸留すべきと言わないの?というか、自分もそうするとは言わないの?

その他
tase
電脳空間カウボーイズのお二人

その他
SanadaSatoshi
“この点に関しては、NTTやNECがとっているような、「クローズドLLM戦略」の方が正しい。みすぼらしいが、理に叶っている。オープンアクセスにすれば必ず蒸留される。蒸留されれば、訓練に使った金は水の泡と化す”

その他
daishi_n
「推論が重要」っていうのは「AIビジネス収穫期の到来」というビジネスワードに置き換えできるし、トレーニングプロセッサも量子化ビット数を最小化して低コスト化できる可能性がある

その他
nakag0711
少なくとも日本法では契約違反に対する損害賠償請求に特約は必要ない。民法415で法定されている

その他

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

アプリのスクリーンショット
いまの話題をアプリでチェック!
  • バナー広告なし
  • ミュート機能あり
  • ダークモード搭載
アプリをダウンロード

関連記事

DeepSeek狂奏曲

DeepSeek狂奏曲 2025.01.30 Updated by Ryo Shimizu on January 30, 2025, 08:35 am JST DeepSeekという...

ブックマークしたユーザー

すべてのユーザーの
詳細を表示します

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

同時期にブックマークされた記事

いま人気の記事 - 企業メディア

企業メディアをもっと読む