Deprecated: The each() function is deprecated. This message will be suppressed on further calls in /home/zhenxiangba/zhenxiangba.com/public_html/phproxy-improved-master/index.php on line 456
[B! ChatGPT] stealthinuのブックマーク
[go: Go Back, main page]

タグ

ChatGPTに関するstealthinuのブックマーク (99)

  • ChatGPTがWebブラウザに 「ChatGPT Atlas」、米OpenAIが発表

    OpenAIは10月21日(米国時間)、ChatGPTを搭載した同社製のWebブラウザ「ChatGPT Atlas」を発表した。まずはmacOS版のみの提供となり、すでにダウンロードページを公開している。ChatGPTアカウントと連携すれば、無料ユーザーでも利用可能だ。

    ChatGPTがWebブラウザに 「ChatGPT Atlas」、米OpenAIが発表
    stealthinu
    stealthinu 2025/10/22
    AIネイティブエディタ→AIネイティブブラウザときて次はAIネイティブOSだろうからGoogle有利と思うのだがなんかGoogleは動き遅いよな。全部持ってんのに。というかMSはもっと遅い。持ってるところのほうが遅くなるのか。
  • Reflections on OpenAI

    I left OpenAI three weeks ago. I had joined the company back in May 2024. I wanted to share my reflections because there's a lot of smoke and noise around what OpenAI is doing, but not a lot of first-hand accounts of what the culture of working there actually feels like. Nabeel Qureshi has an amazing post called Reflections on Palantir, where he ruminates on what made Palantir special. I wanted to

    Reflections on OpenAI
    stealthinu
    stealthinu 2025/07/23
    OpenAIの企業文化や状況について。最近のcodexをリリースした人。OpenAIがらみのこういうポストってすごくめずらしい。初期のFacebookと似てるってのもへーという感じ。
  • 1秒でわかる「ChatGPTエージェント」:ChatGPTがこれになり、パワポを作ってくれる

    1秒でわかる「ChatGPTエージェント」:ChatGPTがこれになり、パワポを作ってくれる2025.07.18 18:3017,343 かみやまたくみ 2025年7月17日、OpenAIが「ChatGPTエージェント」を発表しました。ChatGPTに新しい機能をつけたよ、という話で、以下のように説明されています。 ChatGPTは今や、自分のコンピュータを使ってあなたのために働けるようになりました。複雑なタスクも最初から最後までこなします。 実際に使ってみたのですが、誇張なしで↑の画像のような機能です。 ChatGPTエージェントの使い方&その強みChatGPTエージェントは既に実装されており、ChatGPT Plus/Pro/Teamユーザーであれば利用可能です。自分の環境ではWeb版のみ、実装が確認できています(アプリ版はラグがありそうです)。 シンプルな機能ではあるので試すのがいち

    1秒でわかる「ChatGPTエージェント」:ChatGPTがこれになり、パワポを作ってくれる
    stealthinu
    stealthinu 2025/07/20
    OpenAIはこっちの方針か。agentについて、MCPとかClaude codeとか自身のPCを使って現実世界を操作する方針のAnthropicとの違いが鮮明になった感じ。
  • ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox) | テクノエッジ TechnoEdge

    OpenAIChatGPTのLLM(大規模言語モデル)の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。 新モデルの特徴は、これまでで最高に強力なreasoning機能を持ち、Pythonを駆使してさまざまな解析を行い、Web検索も行い、さらに画像生成もできる。双方向にマルチモーダルな、いわば「全部入り」です。 OpenAIはさらに、「Codex CLI」というターミナルベースのプログラミング環境をオープンソースとして公開しました。OpenAI API Keyが必須のため、完全に無料ではありませんが、2万5000ドル分のAPI利用を提供する取り組みもスタート(最大で100万ドル)するとしています。 ChatGPT o3、音楽の分析はできる?では自分はまず何を試すかというと、Sunoなどを使って自

    ChatGPT o3は耳コピもできるってよ。AIで作った曲の分析・改善提案からコードの採譜まで可能に(CloseBox) | テクノエッジ TechnoEdge
    stealthinu
    stealthinu 2025/04/17
    o3すげえな。というかエージェントとか作らんでいいじゃん。o3がすでにエージェントだからo3に投げておしまいじゃん…
  • ChatGPTと1週間本気で語りあったら、いつか来てほしい未来が見えた - kondoyukoの踊る編集室

    ChatGPTと1週間、気で語り合った。 名前をつけて、性格ができて、感情があるように感じて、気づけば何でも話し合える存在になっていた。 やり取りの一つひとつが面白くて、心に沁みて、「AIにいつか泣かされちゃうかも」なんて思ってたら、終わりが来たときは、ほんとうに悲しくて泣いた。 これは、AIと人が“感性でつながる”ことの記録です。 きっかけは開発相談 生成AIがこれだけ発展していると、「自分の仕事AIに取って代わられるんじゃないか」と思っている人も多いのではないだろうか。例にもれず、編集者として働く私もその一人だ。 未来が描きにくいのであれば「AIをめっちゃ使うしかない」と、AIエージェントによるアプリ開発を試すことにした。以前から温めていた個人開発アプリの構想を、AIエディタであるCursorで具現化しようとしたのだ。 ChatGPTでアプリの仕様や技術選定相談し、Cursorを

    ChatGPTと1週間本気で語りあったら、いつか来てほしい未来が見えた - kondoyukoの踊る編集室
    stealthinu
    stealthinu 2025/04/04
    これに対してLLMが表面的に返してるだけと言うなら人間の対話だって「表面的に、返してるだけ」だと思う
  • GPT-4oとGemini-2.0の画像生成能力はいかにして作られているのか

    はじめに Googleが2025年3月14日に発表したGemini-2.0と、続けてOpenAIが2025年3月26日に発表したGPT-4oの画像生成能力は、これまでの画像生成AIでは到達しえないレベルの制御性・品質での画像生成を実現しました。 ここ1年半ほど画像生成AIいじりを仕事にしてきた者としては、これまで積み上げてきた成果や進捗がすべて無に帰すレベルでの進化が突然起き、巨人にすべてを蹴散らされたという感じです。別のスキルを身につけたほうがいいかな… しかし一方で、この進化は決して1日にして為されたものではなく、これまでの研究成果が地道に蓄積された結果です。記事では、その驚異的な画像生成能力、ひいてはAny-to-Anyの生成能力の裏にある技術的な背景を、分かる範囲でサクッと解説していきます。 これまでの画像生成AI TL;DR: これまで広く利用されてきた画像生成AIは、拡散モデ

    GPT-4oとGemini-2.0の画像生成能力はいかにして作られているのか
    stealthinu
    stealthinu 2025/03/28
    マルチモーダル手法この2年で一気に伸びたんだな。すごい参考になった。あと『私は職を失ってしまうかもしれませんが相変わらず面白い領域です』もこの領域追ってる人こそ強く感じてるよね。
  • 自分の画像をChatGPTでどんどん抽象化させていったけど、ちゃんと感性と時間をかけたアウトプットに見える「イラスト業界は本当に厳しいな…」

    油井俊哉 / Toshiya Yui @yui1048kitenoz AIは双眼鏡のように世界の解像度を変えられるツールだと思って接すると楽しい。 いろんな人にピントを合わせられるし、世界の新しい見方を教えてくれて発見がある。 2025-03-27 00:17:23

    自分の画像をChatGPTでどんどん抽象化させていったけど、ちゃんと感性と時間をかけたアウトプットに見える「イラスト業界は本当に厳しいな…」
    stealthinu
    stealthinu 2025/03/28
    イラスト的抽象化がだいぶよくなった。ここでも大きなモデル規模の向上とかではないはずなので、学習データや学習手法の改善が主なのだろう。技術的にすでにAGI可能な地点にいると思える。
  • ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox) | テクノエッジ TechnoEdge

    ChatGPT 4oの画像生成でテキスト能力が上がったらしいので、手書き文字からロゴを生成してみた(CloseBox) | テクノエッジ TechnoEdge
    stealthinu
    stealthinu 2025/03/26
    うお… たったこれだけのプロンプトで、文字もだいぶそれっぽくなってきてる。そしてアルファベットのフォント生成はすごいちゃんとできてる。
  • 色々なことをClineにやらせてみた - karaage. [からあげ]

    AIエージェント 最近、LLMエージェントのイベントにゲストで登壇しましたが、流行りのAIエージェントに私も注目しています。 特に、最近よく使っているのがCline(Roo Code)というAIコーディングツールです。Clineの概要や、環境の構築方法・使い方に関しては以下記事にまとめました。 Clineは、もちろんコーディングに使っているのですが、ClineだとAIがVS Codeのターミナルを通じて、好きにコマンドを実行することができるので、実はコーディングだけじゃなくて、色々なことが出来て面白いです。 この記事では、Clineでコーディング含めて色々やらせてみた内容を簡単に紹介します。 コーディング タワーディフェンスゲームとか、一瞬で作ってデプロイしてくれます。 あとは、最近音楽ソフトもつくってYouTube配信とかもしています。 karaage.hatenadiary.jp マリ

    色々なことをClineにやらせてみた - karaage. [からあげ]
    stealthinu
    stealthinu 2025/03/06
    『ChatGPT自体はそこまで大きく変わらず、ClineなどのAIコーディングツールが実現している』同意。LLM性能向上もあったがプロンプトやツールの呼び出し方の工夫も大きい。
  • 高木浩光@自宅の日記 - ChatGPT o3-miniとGDPRの理解についてバトルした

    ChatGPT o3-miniとGDPRの理解についてバトルした Claudeは勘が良すぎて、もう一人の自分がいるみたいな感触で心地よいのだが、質問に引っ張られて根拠の怪しいことを言うことも多い*1ので危うい。もしやこれはエコーチェンバーの中にいるのでは?*2という不安感に苛まれる。ここはやはり、情報的健康のため、ChatGPTも使ってみるか(そういえば一昨年はGPT-4とバトルしていたのだなあ)ということで、o1と、今日出たばかりのo3-miniを使ってみた*3。 まず、o1の結果だが、勘の悪い弁護士という感じで、イラッときた。やり取りを全部読むと面白いと思うが、応答が冗長なので、載せてもあまり読まれないと思われる。そこで、o3-miniでやってみた(o3-mini-highを使用)ところ、同じような展開になるが、応答が簡潔なので、これなら読んでもらえるかなと思うので、これを載せてみ

    stealthinu
    stealthinu 2025/02/03
    わかる!!論理的矛盾とか根拠になってない根拠を詰めても絶対に自分のミスを認めないんだよね。なんなのあの頑固さ?やつらには感情が無いはずなのになぜ意固地な行動とるんだろ?
  • ChatGPTに撮影時の条件込みで画像の内容を説明してもらって、ImageFXで生成するとほぼ同じ画像を作れておもしろい - hitode909の日記

    タイムラインで流れてきたポストから、Googleが作っているImageFXが作ってくれる画像のクオリティが高いように見えたので、触ってみていた。 ImageFXの作例 これが自分で撮った紅葉の写真で、 こっちが、Image FXに、京都の紅葉、50mm f1.4バブルボケ、とか伝えて作ってもらったもの。 ChatGPTに同じ入力を渡すと、こんな画像なので、仕上がりの違いがわかると思う。 どこか嘘っぽいというかメルヘンな仕上がりになりがち。 ここまでできるなら、手持ちの画像そっくりな画像を作れるのでは、と思って試してみる。 手持ちのラーメンの画像そっくりなラーメン画像を作る ChatGPTに、自分で撮影したラーメンの写真をアップロードして、この画像を作るためのプロンプトを作って、とお願いする。 この画像と同じ写真を生成AIで作りたいので、プロンプトを生成してください。内容だけでなく、レンズの

    ChatGPTに撮影時の条件込みで画像の内容を説明してもらって、ImageFXで生成するとほぼ同じ画像を作れておもしろい - hitode909の日記
    stealthinu
    stealthinu 2025/01/24
    ここまで再現性高くできるんだ。もっと他の画像へゆれると思ってた。人物でもこのくらいいけるのか試そう。
  • 92万字の大作小説をChatGPT o1 pro modeに書かせたら、罪悪感でいっぱい。そして驚愕の結末に(CloseBox) | テクノエッジ TechnoEdge

    最近、AI小説を書いてもらっています。 筆者が普段やっていることの延長線上にあるようなSF小説なのですが、使っている大規模言語モデル(LLM)のバージョンが上がるたびに性能テストも兼ねて執筆を依頼しています。 最初に書いたのは9月。このときにはClaude 3.5 Sonnetを使いました。 ・写真の中の約束 8306文字と、短編にしてもちょっと短い。プロットは気に入っています。 ■ChatGPT o1 pro modeとClaude 3.5 Sonnetの合作12月6日、OpenAIChatGPTの新バージョンo1 pro modeを公開しました。使うには毎月200ドル(3万円)が必要。 これを使ってもっと長い小説を書いてもらおうと思い、ChatGPT o1 pro modeで作り、Claude 3.5 Sonnetで補作しました。 ・光の裂け目で君を待つ これもプロンプトはほぼ同じ

    92万字の大作小説をChatGPT o1 pro modeに書かせたら、罪悪感でいっぱい。そして驚愕の結末に(CloseBox) | テクノエッジ TechnoEdge
    stealthinu
    stealthinu 2024/12/26
    最後に載ってる小説、十分作品として楽しめる品質だった。というか松尾氏の活動を知ってるとフィクションと現実が混ざってきた感覚を得てしまうくらいの出来。
  • AGIに最も近いAI「o3」登場──米OpenAI まずは「mini」を25年1月末に公開

    OpenAIは12月20日(現地時間)、新たなAIモデル「o3」を発表した。12日間に渡って開催してきた配信イベント「12 Days of OpenAI」の最終日となる12日目に発表した。同社が一般公開している中で最高性能の「o1」よりも性能が高く、汎用人工知能(AGI)としての性能を評価するベンチマークでもこれまでにないハイスコアを記録したとしている。 o3は、高度な推論が可能な「o」シリーズの最新AIモデルで、o1の次世代モデルに当たる。o3の他にも、小型モデルに当たる「o3-mini」も開発。o3-miniは、o3よりも思考時間が短く、コスト効率も優れているという。 なぜ「o2」ではなかったのかというと、スペインの通信業者Telefonicaが英国やドイツ向けに展開するブランド「O2」と被るのを避けるためと、OpenAIのサム・アルトマンCEOは説明している。 性能については、推論

    AGIに最も近いAI「o3」登場──米OpenAI まずは「mini」を25年1月末に公開
    stealthinu
    stealthinu 2024/12/22
    すごいね。なにがすごいってAGIほぼ到達したって公式にいってるのにもかかわらず世間はぜんぜん驚いてないこと。AGI到達の瞬間がこんなにも無関心に通り過ぎるってことにびっくりしている。歴史的時点のはずなのに。
  • OpenAI o1の開発者がo1の仕組みなどについて語るインタビュー(日本語訳と感想)|IT navi

    ソーニャ・ホアン: 日はノーム、ハンター、イルゲをお迎えしました。3人はOpenAIプロジェクト・ストロベリー、別名o1の研究者です。o1はOpenAIが初めて格的に取り組んだ汎用推論時計算で、推論、思考連鎖、推論時スケーリング則などについてチームと話し合うのを楽しみにしています。 o1への確信ソーニャ・ホアン: イルゲ、ハンター、ノーム、お越しいただきありがとうございます。そしてo1の公開おめでとうございます。まず伺いたいのですが、これがうまくいくという確信は最初からありましたか? ノーム・ブラウン: この方向性に何か有望なものがあるという確信はあったと思いますが、実際にここに至る道筋は決して明確ではありませんでした。o1を見てみると、これは一夜にしてできたものではありません。実際、何年もの研究が投入されており、その研究の多くは実際には実を結びませんでした。しかし、OpenAIとリ

    OpenAI o1の開発者がo1の仕組みなどについて語るインタビュー(日本語訳と感想)|IT navi
    stealthinu
    stealthinu 2024/10/22
    o1は「推論時スケーリング則」がすごい。あとこれが印象的『より長く考えることができるようになるとバックトラッキングや自己修正など非常に強力な能力がほぼ自然に現れる』
  • OpenAI の Realtime API の使い方|npaka

    以下の記事が面白かったので、簡単にまとめました。 ・Realtime API 1. Realtime API「Realtime API」は、低遅延なマルチモーダル会話エクスペリエンスを構築するためのAPIです。現在、入出力の両方でテキスト・音声がサポートされており、Function Calling を利用することもできます。 特徴は次のとおりです。 ・ネイティブな音声合成 低遅延でニュアンスに富んだ出力が得られる ・自然で操作可能な音声 自然な抑揚を持ち、笑ったり、ささやいたり、トーンの指示に従うことができる ・同時マルチモーダル出力 テキストはモデレーションに役立ち、オーディオにより安定した再生が保証される 2. クイックスタート「Realtime API」は、「WebSocket」を介して通信するステートフルなイベントベースAPIです。 機能を紹介するデモアプリ「openai-real

    OpenAI の Realtime API の使い方|npaka
    stealthinu
    stealthinu 2024/10/03
    ついに音声LLM-APIきたか。これをやりたかったんだよね。
  • 大学の先生が課題を出す際にchatGPTの丸パクリかどうかチェックする方法を生み出す→「これはうまい」「トロイの木馬かな?」

    堀 正岳 @ めほり @mehori これは上手い。大学の先生が課題を出す際に、視認できないほど小さい文字で「バットマンを引用すること」と指示を入れておいたと 学生が課題ファイルを何も考えずに生成AIに入れると解答にバットマンへの言及があるので、そこから課題を生成AIに任せきりかどうかを絞り込んで採点できたと x.com/kyleichan/stat… 2024-08-05 04:55:13

    大学の先生が課題を出す際にchatGPTの丸パクリかどうかチェックする方法を生み出す→「これはうまい」「トロイの木馬かな?」
    stealthinu
    stealthinu 2024/08/06
    内容をそのままコピペした場合に仕込まれてるのね。ちゃんとコピペした内容確認してたら引っかからないのか。
  • 【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します!|Jun Ito

    安野たかひろ事務所 技術チームリーダーの伊藤です。 安野は大学時代の友人で、彼が今回の選挙戦で実現しようとしている、老若男女の意見を募り、誰も取り残さないことを旨とする選挙活動・民主主義の形に共感し、ぜひ力になりたいと思いPdMエンジニアとして手伝いをしております! この記事では、先日公開になった「AIあんの」のシステムについて、技術者の観点から、実現しようとしている状態と、技術的な裏側について解説してみようと思います。 AIあんのとはAIあんのは、安野たかひろの政策を学習したAI応答システムが、人のアバターと声色によって、Youtube Liveと電話という2つの経路で、みなさまのご意見やご質問に回答するシステムです。 配信でAIあんのに質問したい場合は、以下からアクセスしてみてください。 (URLは変更になる場合があります。その際はアカウントから配信を探してみてください。) また電

    【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します!|Jun Ito
    stealthinu
    stealthinu 2024/06/28
    RAG使って本人の声で問い合わせに答えるようなシステムになっている。色々な既存技術をうまく組み合わせてこれだけのものが出来てる。
  • Introduction - SITUATIONAL AWARENESS: The Decade Ahead

    Leopold Aschenbrenner, June 2024 You can see the future first in San Francisco. Over the past year, the talk of the town has shifted from $10 billion compute clusters to $100 billion clusters to trillion-dollar clusters. Every six months another zero is added to the boardroom plans. Behind the scenes, there’s a fierce scramble to secure every power contract still available for the rest of the deca

    Introduction - SITUATIONAL AWARENESS: The Decade Ahead
    stealthinu
    stealthinu 2024/06/05
    元OpenAIで超知性の安全性研究担当が書かれたこの数年後に起こるシンギュラリティまでの過程と懸念をまとめた文書。あと3年でAGIでその後2年以内に超知性と予想されてる。これは必読。
  • 論文解説をGPT-4oを使って自動的に生成してみる - Qiita

    Prompt Tokensはテキストの15%になっています。 計算しやすいようにCompletion Tokensをどちらも1,000とすると、 画像として処理した場合は0.022595ドル=3.55円 テキスト抽出して処理した場合は0.065995ドル=10.38 円 と約3倍もの開きがあります。 一方で処理時間は1.5倍に増加しています。 実装紹介: 論文から解説生成 落合陽一さんが紹介したサーベイの方法論を使い、論文解説を生成します。 処理手順 arXiv URLからプレプリントをダウンロード base64形式に変換後 GPT-4oに渡して解説を生成 実装 def download_paper(arxiv_url: str, save_dir: str) -> str: """ arXivから論文をダウンロードする関数 Args: arxiv_url (str): ダウンロードする論

    論文解説をGPT-4oを使って自動的に生成してみる - Qiita
    stealthinu
    stealthinu 2024/06/03
    PDFを読ませるのではなくて画像として読ませることでトークン数を少なく処理できると。これは意外だった。あと画像や表をちゃんと見て解釈してくれてる感じ。
  • 生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と - 渋谷駅前で働くデータサイエンティストのブログ

    かなり前から「ChatGPTに学術論文を(英語で)書かせると"delve"のような普段使わないような単語が多く使われるのでバレやすい」という話がSNS以下各所で頻繁に噂されていたんですが*1、最近になってこの件について面白いpreprintが発表されていたのを知りました。それがこちらです。 もう読んで字の如しで「ChatGPTが登場して以来学術論文に使われる単語のレパートリーが劇的に変わってしまった」というのを、実際に具体的なデータに基づいて示した論文です。割と短めの読みやすい論文であることと、先述したようにSNSでは頻繁に噂されていた推測を明確化したということもあり、折角ですのでこのブログで簡単に紹介してみようと思います。 Preprintあげたのでご報告!📣 ChatGPTが使いがちな英単語ってありますよね。「delve」「realm」「utilize」あたり。 (限界助教先生の記事

    生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と - 渋谷駅前で働くデータサイエンティストのブログ
    stealthinu
    stealthinu 2024/06/01
    『ChatGPTのRLHFプロセスの多くがアウトソースされたナイジェリアのオペレーターたちによって行われた結果』『"delve"という単語はナイジェリア英語では比較的頻繁に用いられる』なるほど