DeepSeekは、OpenAIのDALL-E 3の直接の競合であるJanus-Proを立ち上げました

Publié le 18 2月 2025 à 20h19
modifié le 18 2月 2025 à 20h19

DeepSeekは、革新的な生成AIモデルJanus-Proの発表で話題を呼んでいます。DALL-E 3のような巨人を直接ターゲットにしているこの革新は、マルチモーダル生成分野における重要な進展を示しています。最適化されたアプローチと先進的なアーキテクチャにより、テキストからの画像理解の基準を再定義することが期待されています。 Janus-Proは、競合モデルのパフォーマンスを超えています。 拡張されたパラメータネットワークのおかげで、このモデルは複雑な指示を解釈する前例のない能力を示しています。 この技術の環境問題は無視できません。 この挑戦者の出現は、革新がアクセス可能性と力の同義であるべきAIエコシステムの重要な転換点を示しています。企業は、競争が激化する世界に適応する準備をしなければなりません。

DeepSeekがJanus-Proを発表

スタートアップDeepSeekは最近、画像生成を目的とした新しいAIモデルJanus-Proを発表しました。このモデルはDeepSeek-R1の後継であり、市場の最高ソリューション、特にOpenAIのDALL-E 3に匹敵することを目指しています。生成AIエコシステムにおいて極めて重要であるJanus-Proは、これらの巨人に対する直接的な競争相手として位置づけられています。

Janus-Proの基盤技術

モデルJanus-Proは、マルチモーダルAI分野での重要な進展の結果です。2024年末に、DeepSeekは既にJanusFlowを紹介しており、これは自己回帰型言語モデルと革新的な生成モデリング技術rectified flowを統合するフレームワークです。この最新のモデルは、テキスト指示を解釈して画像を生成する能力を持っています。

パフォーマンスと評価

DeepSeekの研究者たちはJanus-Proをいくつかのベンチマークで厳しいテストにかけました。結果は非常に有望でした。特に70億パラメータを持つバージョンは、マルチモーダル理解ベンチマークMMBenchで79.2のスコアを達成し、JanusやTokenFlowなどの競合を上回りました。

DALL-E 3との比較能力

指示の追跡に関するJanus-Proのパフォーマンスも重要な利点です。例として、モデルJanus-Pro-7Bは、ベンチマークGenEvalで0.80のスコアを取得し、DALL-E 3(0.67)を上回りました。これは重要な進展を示しており、DeepSeekの生成AI市場での地位を強化しています。

モデルの取り揃えの拡大

Janus-Proは、10億パラメータと70億パラメータの2サイズで提供されています。この柔軟性は、DeepSeekが採用している視覚エンコードおよびデコード手法のスケーラビリティを示しています。同社は、コードとモデルをオープンソースとして提供し、コミュニティの受け入れと貢献を促進することを決定しました。

制限と進化の展望

Janus-Proは優れた結果を出していますが、いくつかの制限も残っています。入力解像度は384×384ピクセルに制限されており、生成される画像の品質に影響を及ぼす可能性があります。視覚トークナイザーによって引き起こされる再構築の損失が認識されており、意味論的には豊かだが詳細が欠けた画像が生成されています。

研究者たちは、画像の解像度を上げることでJanus-Proのパフォーマンスに顕著な改善がもたらされると考えています。これらの制限を認識することで、DeepSeekは競争力のある提供を保証するためにモデルを継続的に改善することに取り組んでいます。

DeepSeekのJanus-Proに関するよくある質問

Janus-Proの主な特徴は何ですか?
Janus-Proは、最適化されたトレーニング戦略、広範なトレーニングデータの統合、そして高度なマルチモーダルモデリングにより、テキストコマンドから画像を解釈し生成する能力で際立っています。
Janus-ProはDALL-E 3とどう比較されますか?
Janus-Proは10億および70億パラメータのモデルで、マルチモーダル理解のベンチマークで優れたパフォーマンスを示し、複数の指示追跡テストでDALL-E 3を上回っています。
Janus-Proはオープンソースモデルですか?
はい、DeepSeekはJanus-Proをオープンソースモデルとして提供しており、コミュニティがコードおよびモデルにアクセスし、継続的な使用と改善を行えるようにしています。
Janus-Proの制限は何ですか?
Janus-Proの主な制限の一つは、入力解像度が384×384ピクセルに制限されているため、高精度を必要とするタスクでのパフォーマンスに影響を与える可能性があることです。
Janus-Proにはどうやってアクセスできますか?
Janus-ProはAIモデル共有専用プラットフォームで公に利用可能で、ユーザーはそれをダウンロードして探索することができます。
Janus-ProはJanusに対してどのような改善をもたらしますか?
Janus-Proは、高度なモデルアーキテクチャを通じて、テキスト指示の解釈を改善し、マルチモーダル理解と視覚生成を向上させます。
Janus-Proはプロフェッショナルユーザー向けですか、それとも一般ユーザー向けですか?
Janus-Proは、研究者や開発者からアーティストやデザイナーまで、様々なユーザーが使用できるように設計されており、オープンソースのアプローチと高い画像生成性能を誇っています。
Janus-Proのようなマルチモーダルモデルを使用する利点は何ですか?
Janus-Proのようなマルチモーダルモデルは、テキストと画像との関係をより深く理解し、より正確で文脈に適した画像生成を可能にします。

actu.iaNon classéDeepSeekは、OpenAIのDALL-E 3の直接の競合であるJanus-Proを立ち上げました

アマゾンはペンシルベニア州に20億ドルをデータセンターに投資しており、その中には原子力発電所の近くにあるものも含まれています

découvrez comment amazon prévoit d'investir 20 milliards de dollars dans des centres de données en pennsylvanie, incluant l'un d'eux situé à proximité d'une centrale nucléaire. un projet ambitieux qui promet de transformer le paysage technologique et économique de la région.

視覚コンテンツをAIを通じて機械が解釈できるようにする

découvrez comment l'intelligence artificielle révolutionne l'interprétation du contenu visuel par les machines. apprenez les techniques innovantes qui permettent aux systèmes automatisés de comprendre et d'analyser les images, améliorant ainsi leur efficacité dans diverses applications.
découvrez comment tata, la jeune artiste propulsée par timbaland, attire l'attention et suscite des débats passionnés. plongez dans l'univers de cette talentueuse musicienne et les explications du célèbre producteur face aux controverses qui l'entourent.
découvrez comment apple se positionne en vue de son événement annuel en pleine turbulence technologique, entre défis liés à l'intelligence artificielle, bouleversements du marché et tensions commerciales sous l'ère trump.

Perplexity AIは5月中に7億回のリクエストを記録しました

découvrez comment perplexity ai a enregistré 708 millions de requêtes en mai, un chiffre impressionnant qui témoigne de l'engouement croissant pour l'intelligence artificielle et son utilisation par les utilisateurs. explorez les implications de cette tendance dans notre article.
découvrez les détails de l'acquisition par openai de la start-up fondée par jony ive, l'ancien designer emblématique d'apple, pour un montant impressionnant de 6,5 milliards de dollars. analyse des enjeux et des perspectives d'avenir.