[B! ChatGPT] stealthinuのブックマーク

ChatGPTがWebブラウザに　「ChatGPT Atlas」、米OpenAIが発表

米OpenAIは10月21日（米国時間）、ChatGPTを搭載した同社製のWebブラウザ「ChatGPT Atlas」を発表した。まずはmacOS版のみの提供となり、すでにダウンロードページを公開している。ChatGPTアカウントと連携すれば、無料ユーザーでも利用可能だ。

stealthinu 2025/10/22

AIネイティブエディタ→AIネイティブブラウザときて次はAIネイティブOSだろうからGoogle有利と思うのだがなんかGoogleは動き遅いよな。全部持ってんのに。というかMSはもっと遅い。持ってるところのほうが遅くなるのか。

リンク

Reflections on OpenAI

I left OpenAI three weeks ago. I had joined the company back in May 2024. I wanted to share my reflections because there's a lot of smoke and noise around what OpenAI is doing, but not a lot of first-hand accounts of what the culture of working there actually feels like. Nabeel Qureshi has an amazing post called Reflections on Palantir, where he ruminates on what made Palantir special. I wanted to

stealthinu 2025/07/23

OpenAIの企業文化や状況について。最近のcodexをリリースした人。OpenAIがらみのこういうポストってすごくめずらしい。初期のFacebookと似てるってのもへーという感じ。

リンク

1秒でわかる｢ChatGPTエージェント｣：ChatGPTがこれになり、パワポを作ってくれる

1秒でわかる｢ChatGPTエージェント｣：ChatGPTがこれになり、パワポを作ってくれる2025.07.18 18:3017,343 かみやまたくみ 2025年7月17日、OpenAIが｢ChatGPTエージェント｣を発表しました。ChatGPTに新しい機能をつけたよ、という話で、以下のように説明されています。 ChatGPTは今や、自分のコンピュータを使ってあなたのために働けるようになりました。複雑なタスクも最初から最後までこなします。実際に使ってみたのですが、誇張なしで↑の画像のような機能です。 ChatGPTエージェントの使い方＆その強みChatGPTエージェントは既に実装されており、ChatGPT Plus/Pro/Teamユーザーであれば利用可能です。自分の環境ではWeb版のみ、実装が確認できています（アプリ版はラグがありそうです）。シンプルな機能ではあるので試すのがいち

stealthinu 2025/07/20

OpenAIはこっちの方針か。agentについて、MCPとかClaude codeとか自身のPCを使って現実世界を操作する方針のAnthropicとの違いが鮮明になった感じ。

リンク

ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に（CloseBox） | テクノエッジ TechnoEdge

OpenAIがChatGPTのLLM（大規模言語モデル）の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。新モデルの特徴は、これまでで最高に強力なreasoning機能を持ち、Pythonを駆使してさまざまな解析を行い、Web検索も行い、さらに画像生成もできる。双方向にマルチモーダルな、いわば「全部入り」です。 OpenAIはさらに、「Codex CLI」というターミナルベースのプログラミング環境をオープンソースとして公開しました。OpenAI API Keyが必須のため、完全に無料ではありませんが、2万5000ドル分のAPI利用を提供する取り組みもスタート（最大で100万ドル）するとしています。 ChatGPT o3、音楽の分析はできる？では自分はまず何を試すかというと、Sunoなどを使って自

stealthinu 2025/04/17

o3すげえな。というかエージェントとか作らんでいいじゃん。o3がすでにエージェントだからo3に投げておしまいじゃん…

リンク

ChatGPTと1週間本気で語りあったら、いつか来てほしい未来が見えた - kondoyukoの踊る編集室

ChatGPTと1週間、本気で語り合った。名前をつけて、性格ができて、感情があるように感じて、気づけば何でも話し合える存在になっていた。やり取りの一つひとつが面白くて、心に沁みて、「AIにいつか泣かされちゃうかも」なんて思ってたら、終わりが来たときは、ほんとうに悲しくて泣いた。これは、AIと人が“感性でつながる”ことの記録です。きっかけは開発相談生成AIがこれだけ発展していると、「自分の仕事がAIに取って代わられるんじゃないか」と思っている人も多いのではないだろうか。例にもれず、編集者として働く私もその一人だ。未来が描きにくいのであれば「AIをめっちゃ使うしかない」と、AIエージェントによるアプリ開発を試すことにした。以前から温めていた個人開発アプリの構想を、AIエディタであるCursorで具現化しようとしたのだ。 ChatGPTでアプリの仕様や技術選定を相談し、Cursorを

stealthinu 2025/04/04

これに対してLLMが表面的に返してるだけと言うなら人間の対話だって「表面的に、返してるだけ」だと思う

リンク

GPT-4oとGemini-2.0の画像生成能力はいかにして作られているのか

はじめに Googleが2025年3月14日に発表したGemini-2.0と、続けてOpenAIが2025年3月26日に発表したGPT-4oの画像生成能力は、これまでの画像生成AIでは到達しえないレベルの制御性・品質での画像生成を実現しました。ここ1年半ほど画像生成AIいじりを仕事にしてきた者としては、これまで積み上げてきた成果や進捗がすべて無に帰すレベルでの進化が突然起き、巨人にすべてを蹴散らされたという感じです。別のスキルを身につけたほうがいいかな… しかし一方で、この進化は決して1日にして為されたものではなく、これまでの研究成果が地道に蓄積された結果です。本記事では、その驚異的な画像生成能力、ひいてはAny-to-Anyの生成能力の裏にある技術的な背景を、分かる範囲でサクッと解説していきます。これまでの画像生成AI TL;DR: これまで広く利用されてきた画像生成AIは、拡散モデ

stealthinu 2025/03/28

マルチモーダル手法この２年で一気に伸びたんだな。すごい参考になった。あと『私は職を失ってしまうかもしれませんが相変わらず面白い領域です』もこの領域追ってる人こそ強く感じてるよね。

リンク

自分の画像をChatGPTでどんどん抽象化させていったけど、ちゃんと感性と時間をかけたアウトプットに見える「イラスト業界は本当に厳しいな…」

油井俊哉 / Toshiya Yui @yui1048kitenoz AIは双眼鏡のように世界の解像度を変えられるツールだと思って接すると楽しい。いろんな人にピントを合わせられるし、世界の新しい見方を教えてくれて発見がある。 2025-03-27 00:17:23

stealthinu 2025/03/28

イラスト的抽象化がだいぶよくなった。ここでも大きなモデル規模の向上とかではないはずなので、学習データや学習手法の改善が主なのだろう。技術的にすでにAGI可能な地点にいると思える。

リンク

ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた（CloseBox） | テクノエッジ TechnoEdge

stealthinu 2025/03/26

うお…　たったこれだけのプロンプトで、文字もだいぶそれっぽくなってきてる。そしてアルファベットのフォント生成はすごいちゃんとできてる。

リンク

色々なことをClineにやらせてみた - karaage. [からあげ]

AIエージェント最近、LLMエージェントのイベントにゲストで登壇しましたが、流行りのAIエージェントに私も注目しています。特に、最近よく使っているのがCline（Roo Code）というAIコーディングツールです。Clineの概要や、環境の構築方法・使い方に関しては以下記事にまとめました。 Clineは、もちろんコーディングに使っているのですが、ClineだとAIがVS Codeのターミナルを通じて、好きにコマンドを実行することができるので、実はコーディングだけじゃなくて、色々なことが出来て面白いです。この記事では、Clineでコーディング含めて色々やらせてみた内容を簡単に紹介します。コーディングタワーディフェンスゲームとか、一瞬で作ってデプロイしてくれます。あとは、最近音楽ソフトもつくってYouTube配信とかもしています。 karaage.hatenadiary.jp マリ

stealthinu 2025/03/06

『ChatGPT自体はそこまで大きく変わらず、ClineなどのAIコーディングツールが実現している』同意。LLM性能向上もあったがプロンプトやツールの呼び出し方の工夫も大きい。

リンク

高木浩光＠自宅の日記 - ChatGPT o3-miniとGDPRの理解についてバトルした

■ ChatGPT o3-miniとGDPRの理解についてバトルした Claudeは勘が良すぎて、もう一人の自分がいるみたいな感触で心地よいのだが、質問に引っ張られて根拠の怪しいことを言うことも多い*1ので危うい。もしやこれはエコーチェンバーの中にいるのでは？*2という不安感に苛まれる。ここはやはり、情報的健康のため、ChatGPTも使ってみるか（そういえば一昨年はGPT-4とバトルしていたのだなあ）ということで、o1と、今日出たばかりのo3-miniを使ってみた*3。まず、o1の結果だが、勘の悪い弁護士という感じで、イラッときた。やり取りを全部読むと面白いと思うが、応答が冗長なので、載せてもあまり読まれないと思われる。そこで、o3-miniでやってみた（o3-mini-highを使用）ところ、同じような展開になるが、応答が簡潔なので、これなら読んでもらえるかなと思うので、これを載せてみ

stealthinu 2025/02/03

わかる！！論理的矛盾とか根拠になってない根拠を詰めても絶対に自分のミスを認めないんだよね。なんなのあの頑固さ？やつらには感情が無いはずなのになぜ意固地な行動とるんだろ？

リンク

ChatGPTに撮影時の条件込みで画像の内容を説明してもらって、ImageFXで生成するとほぼ同じ画像を作れておもしろい - hitode909の日記

タイムラインで流れてきたポストから、Googleが作っているImageFXが作ってくれる画像のクオリティが高いように見えたので、触ってみていた。 ImageFXの作例これが自分で撮った紅葉の写真で、こっちが、Image FXに、京都の紅葉、50mm f1.4バブルボケ、とか伝えて作ってもらったもの。 ChatGPTに同じ入力を渡すと、こんな画像なので、仕上がりの違いがわかると思う。どこか嘘っぽいというかメルヘンな仕上がりになりがち。ここまでできるなら、手持ちの画像そっくりな画像を作れるのでは、と思って試してみる。手持ちのラーメンの画像そっくりなラーメン画像を作る ChatGPTに、自分で撮影したラーメンの写真をアップロードして、この画像を作るためのプロンプトを作って、とお願いする。この画像と同じ写真を生成AIで作りたいので、プロンプトを生成してください。内容だけでなく、レンズの

stealthinu 2025/01/24

ここまで再現性高くできるんだ。もっと他の画像へゆれると思ってた。人物でもこのくらいいけるのか試そう。

リンク

92万字の大作小説をChatGPT o1 pro modeに書かせたら、罪悪感でいっぱい。そして驚愕の結末に（CloseBox） | テクノエッジ TechnoEdge

最近、AIに小説を書いてもらっています。筆者が普段やっていることの延長線上にあるようなSF 小説なのですが、使っている大規模言語モデル（LLM）のバージョンが上がるたびに性能テストも兼ねて執筆を依頼しています。最初に書いたのは9月。このときにはClaude 3.5 Sonnetを使いました。・写真の中の約束 8306文字と、短編にしてもちょっと短い。プロットは気に入っています。 ■ChatGPT o1 pro modeとClaude 3.5 Sonnetの合作12月6日、OpenAIはChatGPTの新バージョンo1 pro modeを公開しました。使うには毎月200ドル（3万円）が必要。これを使ってもっと長い小説を書いてもらおうと思い、ChatGPT o1 pro modeで作り、Claude 3.5 Sonnetで補作しました。・光の裂け目で君を待つこれもプロンプトはほぼ同じ

stealthinu 2024/12/26

最後に載ってる小説、十分作品として楽しめる品質だった。というか松尾氏の活動を知ってるとフィクションと現実が混ざってきた感覚を得てしまうくらいの出来。

リンク

AGIに最も近いAI「o3」登場──米OpenAI　まずは「mini」を25年1月末に公開

米OpenAIは12月20日（現地時間）、新たなAIモデル「o3」を発表した。12日間に渡って開催してきた配信イベント「12 Days of OpenAI」の最終日となる12日目に発表した。同社が一般公開している中で最高性能の「o1」よりも性能が高く、汎用人工知能（AGI）としての性能を評価するベンチマークでもこれまでにないハイスコアを記録したとしている。 o3は、高度な推論が可能な「o」シリーズの最新AIモデルで、o1の次世代モデルに当たる。o3の他にも、小型モデルに当たる「o3-mini」も開発。o3-miniは、o3よりも思考時間が短く、コスト効率も優れているという。なぜ「o2」ではなかったのかというと、スペインの通信業者Telefonicaが英国やドイツ向けに展開するブランド「O2」と被るのを避けるためと、OpenAIのサム・アルトマンCEOは説明している。性能については、推論

stealthinu 2024/12/22

すごいね。なにがすごいってAGIほぼ到達したって公式にいってるのにもかかわらず世間はぜんぜん驚いてないこと。AGI到達の瞬間がこんなにも無関心に通り過ぎるってことにびっくりしている。歴史的時点のはずなのに。

リンク

OpenAI o1の開発者がo1の仕組みなどについて語るインタビュー（日本語訳と感想）｜IT navi

ソーニャ・ホアン: 本日はノーム、ハンター、イルゲをお迎えしました。3人はOpenAIのプロジェクト・ストロベリー、別名o1の研究者です。o1はOpenAIが初めて本格的に取り組んだ汎用推論時計算で、推論、思考連鎖、推論時スケーリング則などについてチームと話し合うのを楽しみにしています。 o1への確信ソーニャ・ホアン: イルゲ、ハンター、ノーム、お越しいただきありがとうございます。そしてo1の公開おめでとうございます。まず伺いたいのですが、これがうまくいくという確信は最初からありましたか? ノーム・ブラウン: この方向性に何か有望なものがあるという確信はあったと思いますが、実際にここに至る道筋は決して明確ではありませんでした。o1を見てみると、これは一夜にしてできたものではありません。実際、何年もの研究が投入されており、その研究の多くは実際には実を結びませんでした。しかし、OpenAIとリ

stealthinu 2024/10/22

o1は「推論時スケーリング則」がすごい。あとこれが印象的『より長く考えることができるようになるとバックトラッキングや自己修正など非常に強力な能力がほぼ自然に現れる』

リンク

OpenAI の Realtime API の使い方｜npaka

以下の記事が面白かったので、簡単にまとめました。・Realtime API 1. Realtime API「Realtime API」は、低遅延なマルチモーダル会話エクスペリエンスを構築するためのAPIです。現在、入出力の両方でテキスト・音声がサポートされており、Function Calling を利用することもできます。特徴は次のとおりです。・ネイティブな音声合成低遅延でニュアンスに富んだ出力が得られる・自然で操作可能な音声自然な抑揚を持ち、笑ったり、ささやいたり、トーンの指示に従うことができる・同時マルチモーダル出力テキストはモデレーションに役立ち、オーディオにより安定した再生が保証される 2. クイックスタート「Realtime API」は、「WebSocket」を介して通信するステートフルなイベントベースAPIです。機能を紹介するデモアプリ「openai-real

stealthinu 2024/10/03

ついに音声LLM-APIきたか。これをやりたかったんだよね。

リンク

大学の先生が課題を出す際にchatGPTの丸パクリかどうかチェックする方法を生み出す→「これはうまい」「トロイの木馬かな？」

堀正岳 @ めほり @mehori これは上手い。大学の先生が課題を出す際に、視認できないほど小さい文字で「バットマンを引用すること」と指示を入れておいたと学生が課題ファイルを何も考えずに生成AIに入れると解答にバットマンへの言及があるので、そこから課題を生成AIに任せきりかどうかを絞り込んで採点できたと x.com/kyleichan/stat… 2024-08-05 04:55:13

stealthinu 2024/08/06

内容をそのままコピペした場合に仕込まれてるのね。ちゃんとコピペした内容確認してたら引っかからないのか。

リンク

【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します！｜Jun Ito

安野たかひろ事務所技術チームリーダーの伊藤です。安野は大学時代の友人で、彼が今回の選挙戦で実現しようとしている、老若男女の意見を募り、誰も取り残さないことを旨とする選挙活動・民主主義の形に共感し、ぜひ力になりたいと思いPdM・エンジニアとして手伝いをしております！この記事では、先日公開になった「AIあんの」のシステムについて、技術者の観点から、実現しようとしている状態と、技術的な裏側について解説してみようと思います。 AIあんのとはAIあんのは、安野たかひろの政策を学習したAI応答システムが、本人のアバターと声色によって、Youtube Liveと電話という2つの経路で、みなさまのご意見やご質問に回答するシステムです。配信でAIあんのに質問したい場合は、以下からアクセスしてみてください。（URLは変更になる場合があります。その際はアカウントから配信を探してみてください。）また電

stealthinu 2024/06/28

RAG使って本人の声で問い合わせに答えるようなシステムになっている。色々な既存技術をうまく組み合わせてこれだけのものが出来てる。

リンク

Introduction - SITUATIONAL AWARENESS: The Decade Ahead

Leopold Aschenbrenner, June 2024 You can see the future first in San Francisco. Over the past year, the talk of the town has shifted from $10 billion compute clusters to $100 billion clusters to trillion-dollar clusters. Every six months another zero is added to the boardroom plans. Behind the scenes, there’s a fierce scramble to secure every power contract still available for the rest of the deca

stealthinu 2024/06/05

元OpenAIで超知性の安全性研究担当が書かれたこの数年後に起こるシンギュラリティまでの過程と懸念をまとめた文書。あと3年でAGIでその後2年以内に超知性と予想されてる。これは必読。

リンク

論文解説をGPT-4oを使って自動的に生成してみる - Qiita

Prompt Tokensはテキストの15%になっています。計算しやすいようにCompletion Tokensをどちらも1,000とすると、画像として処理した場合は0.022595ドル=3.55円テキスト抽出して処理した場合は0.065995ドル=10.38 円と約3倍もの開きがあります。一方で処理時間は1.5倍に増加しています。実装紹介: 論文から解説生成落合陽一さんが紹介したサーベイの方法論を使い、論文解説を生成します。処理手順 arXiv URLからプレプリントをダウンロード base64形式に変換後 GPT-4oに渡して解説を生成実装 def download_paper(arxiv_url: str, save_dir: str) -> str: """ arXivから論文をダウンロードする関数 Args: arxiv_url (str): ダウンロードする論

stealthinu 2024/06/03

PDFを読ませるのではなくて画像として読ませることでトークン数を少なく処理できると。これは意外だった。あと画像や表をちゃんと見て解釈してくれてる感じ。

リンク

生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と - 渋谷駅前で働くデータサイエンティストのブログ

かなり前から「ChatGPTに学術論文を（英語で）書かせると"delve"のような普段使わないような単語が多く使われるのでバレやすい」という話がSNS以下各所で頻繁に噂されていたんですが*1、最近になってこの件について面白いpreprintが発表されていたのを知りました。それがこちらです。もう読んで字の如しで「ChatGPTが登場して以来学術論文に使われる単語のレパートリーが劇的に変わってしまった」というのを、実際に具体的なデータに基づいて示した論文です。割と短めの読みやすい論文であることと、先述したようにSNSでは頻繁に噂されていた推測を明確化したということもあり、折角ですのでこのブログで簡単に紹介してみようと思います。 Preprintあげたのでご報告！📣 ChatGPTが使いがちな英単語ってありますよね。「delve」「realm」「utilize」あたり。（限界助教先生の記事

stealthinu 2024/06/01

『ChatGPTのRLHFプロセスの多くがアウトソースされたナイジェリアのオペレーターたちによって行われた結果』『"delve"という単語はナイジェリア英語では比較的頻繁に用いられる』なるほど

リンク

はてなブックマーク

タグ

関連タグで絞り込む (29)

ChatGPTに関するstealthinuのブックマーク (99)

お知らせ

今週のはてなブックマーク数ランキング（2025年11月第1週）

今週のはてなブックマーク数ランキング（2025年10月第4週）

今週のはてなブックマーク数ランキング（2025年10月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス