AIとMLの日本語ニュース - TheNote.app

AIとMLの日本語ニュース
フォロー

"「AI & ML News "は、人工知能と機械学習に焦点を当てた技術ノート集です。AIとMLの最新動向に関するニュースやレビューを集めています。このフィードは、新しいアルゴリズム、アプリケーション、研究を含む幅広いトピックをカバーしています。業界の動向や、AIやMLが経済の様々な分野に与える影響についても取り上げています。ニューラル・ネットワーク、ディープラーニング、自然言語処理などの分野に触れています。ヘルスケア、金融、その他の産業におけるAIの応用例も検討されている。本書は、開発者やデータアナリストといった専門家だけでなく、AI技術の発展に関心のあるすべての人にとっても興味深い内容となっている。AIの倫理やデータ・プライバシーの問題にも言及している。このフィードでは、大企業から有望な新興企業まで、AI市場の主要プレーヤーを紹介しています。AIシステム開発のためのツールやプラットフォームに関する情報も紹介している。「AI & ML News」は、人工知能と機械学習の発展に関する客観的で最新の情報を提供することを目的としています。

RSS Hunter • 2024年7月27日

ノートのスレッド

トランスフォーマー：アテンションの時代

2017年に、研究者たちは「Attention is All You Need」の論文でTransformerモデルを発表し、自然言語処理（NLP）に革命を起こしました。以前のRNNやLSTMなどのモデルは、単語を順次処理していたため、長い文章を処理する能力が制限され、トレーニングが遅くなり、並列処理が妨げられていました。Transformerは自己アテンションを使用することでこれらの問題を解決し、モデルが文章内の位置に関係なく重要な単語に焦点を当てることができました。これにより、Transformerは特に並列化を活用することで、より高速でスケーラブルになりました。逐次的な単語処理の必要性を排除し、単語間の複雑な関係の理解が向上しました。モデルのエンコーダーとデコーダーのアーキテクチャは、入力シーケンスを翻訳などの出力に効率的に処理します。多頭アテンションなどの重要な機能により、モデルは文章内の意味のさまざまな側面を同時に捉えることができます。デコーダーは前の単語のみに焦点を当てて、翻訳をステップバイステップで生成し、精度を確保します。このアーキテクチャはBERTやGPTなどの多くの最先端モデルの基盤となり、さまざまなNLPタスクでのパフォーマンスを大幅に向上させました。

Transformers: Age of Attention hackernoon.com

RSS Hunter • 2024年9月13日

NLP、BigQuery、エンベディングを使用したマルチモーダル検索ソリューション

このブログでは、検索テクノロジーがテキストを超えて進歩し、マルチモーダル埋め込みにより、画像やビデオが検索機能に組み込まれる様子について説明しています。従来の企業向け検索エンジンはテキストベースのクエリ用に設計されていたため、視覚コンテンツを扱う能力が制限されていました。自然言語処理 (NLP) とマルチモーダル埋め込みを統合することで、今やクロスモーダル意味検索を実行できるようになり、ユーザーはテキストと同じように画像やビデオを検索できるようになりました。このブログでは、Google Cloud Storage をメディアストレージに使用し、BigQuery をインデックス作成に使用して、テキストから画像、テキストからビデオ、および複合検索を実行できるシステムを示します。マルチモーダル埋め込みモデルは、メディアファイルの埋め込みを生成するために使用され、効率的な類似度検索が可能になります。このアーキテクチャはシームレスなクロスモーダル検索体験をサポートし、コンテンツの発見をより直感的なものにします。ユーザーのテキスト入力が埋め込みに変換され、ベクトル検索が実行されて、クエリが格納されたメディアデータと照合されます。最後に、最も関連性の高い画像またはビデオの URI と類似度スコアを使用して、結果がユーザーに表示されます。このアプローチにより検索エクスペリエンスが向上し、視覚コンテンツを検索する新しい可能性が開かれます。

A multimodal search solution using NLP, BigQuery and embeddings cloud.google.com

RSS Hunter • 2024年9月12日

2024年の機械学習に必須のPythonライブラリ10選

2024年も、機械学習（ML）は急速な進化を続けています。豊富なライブラリエコシステムを持つPythonは、ML開発の最先端を走り続けています。この記事では、2024年のMLシーンを席巻するトップ10のPythonライブラリ、2020年以降の分野の変化、そして重要な[...]について探ります。

10 Must-Know Python Libraries for Machine Learning in 2024 machinelearningmastery.com

RSS Hunter • 2024年9月12日

AI駆動型GitHub READMEジェネレータ

AI搭載のREADMEジェネレーターは、開発者が自身のGitHubプロジェクトに対して、高品質なREADMEファイルを作成できるように設計された新しいツールです。このツールは、基本的なプロジェクト情報を使用して、構造化されたプロフェッショナルなREADMEファイルを生成することで、ドキュメント作成プロセスを簡素化します。GitHub風のマークダウンでスマートフォーマットを提供し、さまざまな種類のプロジェクトに適した各種テンプレートを提供します。また、プロジェクトの性質に基づいた関連セクションを提案し、明確かつ魅力的な言葉遣いに改善します。このツールを使用することで、開発者は時間を節約し、プロジェクトの可視性を向上させ、ドキュメントが明確、簡潔、かつ一貫性があることを確保できます。全く新しいREADMEファイルを作成したり、現在のコンテンツを分析して改善点を提案したりして、既存のファイルを洗練したりすることがサポートされています。ユーザーは、GitHubリポジトリにコミットする前に、生成されたコンテンツを確認し、プロジェクトのニーズに合わせてカスタマイズできるため、他の人がプロジェクトを理解して貢献することが容易になります。全体として、コラボレーションを強化し、プロジェクトをよりプロフェッショナルに披露する、効果的な方法です。

AI-Powered GitHub README Generator dev.to

RSS Hunter • 2024年9月12日

機械学習スキルを向上させましょう：数学と統計の無料コース

機械学習の世界に飛び込むことを熱望していますが、数学と統計に少し圧倒されていますか? 心配しないでください。あなただけではありません! 多くの志望データサイエンティストにとって、これらのトピックは気が遠くなるものです。良い知らせは、堅実な基盤を築くのに役立つ無料のオンラインコースが数多くあることです。Coursera:アンドリュー・ンによる機械学習: この伝説的なコースは、機械学習の概念を紹介するだけでなく、強力な数学的基礎も提供します。インペリアルカレッジロンドンによる機械学習の数学: 数学的コンセプトに深く飛び込みたいのであれば、このコースは素晴らしい選択肢です。edX:マイクロソフトによる機械学習の基礎: このコースは、機械学習の基礎と必要な数学的知識を組み合わせたバランスの取れたアプローチを提供します。コロンビア大学によるデータサイエンスの基礎: 統計と機械学習を含むデータサイエンスに関するより広い視点がこのコースで提供されています。 MIT OpenCourseWare:アルゴリズム入門: 機械学習に関するものではありませんが、このコースはアルゴリズムとデータ構造の強力な基盤を築き、機械学習の概念を理解するために不可欠です。確率と確率変数: 確率論を深く掘り下げることは、多くの機械学習アルゴリズムを理解するために不可欠です。カーンアカデミー:線形代数: 機械学習の基本的なトピックである線形代数を学ぶための包括的なリソース。微積分: もう 1 つの不可欠な数学的コンセプトである微積分は、カーンアカデミーで詳しく扱われています。統計と確率: 統計と確率の確固たる理解は、データ分析と機械学習にとって不可欠です。覚えておいてください: これらのコースは貴重なリソースを提供しますが、一貫した実践と実践的な経験がこれらのトピックをマスターするための鍵です。基本から始めて、自信がついたら徐々に複雑さを増やしてください。献身と適切なリソースがあれば、熟練した機械学習プラクティショナーになる道が開かれます。学習を楽しんでください!

Boost Your Machine Learning Skills: Free Courses for Math and Statistics dev.to

RSS Hunter • 2024年9月10日

サカナAIの「AIサイエンティスト」: 次なるアインシュタインか、単なるツールか?

人工知能において、科学的発見のプロセスそのものを作り変えると期待される画期的な開発が登場しました。オックスフォード大学のフォースターAI研究所とブリティッシュコロンビア大学の研究者との協力により、Sakana AIは包括的なシステムである「AI科学者」を発表しました。そのシステムは、完全に設計されています。[…]

Sakana AI’s “AI Scientist”: The Next Einstein or Just a Tool? analyticsvidhya.com

RSS Hunter • 2024年9月10日

Open CV と Python を使用した手話認識器: 手のジェスチャ認識

オープンCVとPythonを使用した手振り認識OpenCVとPythonを使用した、手話のジェスチャーを検出できる手振り認識プログラムをデモしたYouTubeビデオを作成しました！✋🤖このプロジェクトでは、次のことを行いました。 - コンピュータービジョン用のOpenCVとPythonの設定 - リアルタイムのビデオ入力をキャプチャして処理 - ジェスチャー認識用の機械学習の実装 - 手話のジェスチャーの検出と解釈

Sign Language Detector with Open CV and Python: Hand Gesture Recognition dev.to

RSS Hunter • 2024年9月10日

今年ヨーロッパのAIで最も注目されている案件

2024 年にはヨーロッパの AI セクターはベンチャーキャピタル資金でかなりの回復力を見せ、8 月時点で 1,400 万ドルを超える 14 件の投資が行われました。これは、資金の確保が困難だったスタートアップの全体的な困難な状況とは対照的です。とりわけ、AI は AI テクノロジーの開発に関連する高いコストと人材の激しい競争によって推進され、投資の強固な領域として浮上しました。今年ヨーロッパで行われた主要な AI 取引における主なハイライトは次のとおりです。- Wayve: ケンブリッジに拠点を置くこのスタートアップは、自律運転技術を強化するために 10 億 5,000 万ドルを調達し、ヨーロッパの AI 企業にとって単一の最大の資金調達ラウンドとなりました。Wayve は、車両自体の生産ではなく、AI 技術を自動車メーカーに販売することに焦点を当てています。 - Mistral: 大規模言語モデルの構築における著名なプレーヤーである Mistral は、4 億 3,100 万ドルと 6 億 5,000 万ドルという 2 回の重要な資金調達ラウンドを通じて 10 億ドル以上を調達しました。同社はオープンソーステクノロジーを重視しており、企業や開発者にアピールしています。 - Helsing: 防衛アプリケーション用の AI に焦点を当てているこのドイツのスタートアップは、4 億 8,400 万ドルを確保しました。その技術は、特にヨーロッパの地政学的緊張の高まりを背景に、防衛システムと能力の強化を目的としています。 - Poolside: ソフトウェア開発者をターゲットにした Poolside は、ソフトウェア開発プロセスを効率化する AI ツールを開発するために 4 億ドルを調達しました。 - DeepL: AI による翻訳サービスで知られる DeepL は、3 億 2,000 万ドルを調達し、約 10 万人のビジネス顧客を抱える B2B 市場に焦点を当てました。 - H: 旧 Holistic AI は、シードラウンドとして 2 億 2,000 万ドルを調達し、タスク自動化と意思決定のための AI エージェントの開発を目指しています。 - Flo Health: ロンドンに拠点を置く女性の健康アプリは、2 億ドルを調達し、10 億ドル以上の評価額を達成した初の純粋なデジタルヘルスアプリになりました。 - Pigment: エンタープライズリソースプランニングソリューションを提供するこのパリのスタートアップは、1 億 4,500 万ドルを調達し、AI を製品に統合しました。全体として、ヨーロッパの AI 業界は、大幅な資金調達ラウンドと基本的なテクノロジーへの焦点が特徴であり、パリなどの都市が AI 開発の主要な拠点として浮上しています。

The top AI deals in Europe this year techcrunch.com

RSS Hunter • 2024年9月10日

Substack（YC W18）は機械学習エンジニアを募集しています

概要サブスタックのMLエンジニアとして、最先端の機械学習ソリューションの開発と実装で重要な役割を担います。ソフトウェアエンジニアやデータサイエンティストと緊密に連携する、ダイナミックなチームの一員となり、機械学習モデルをコードベースに取り入れ、製品にシームレスに統合します。この役割は、テクノロジースタックの将来を形作り、大きな影響を与えるエキサイティングな機会です。サブスタックの報酬パッケージには、市場競争力のある給与、フルタイムのすべての役割に対するエクイティ、優れた福利厚生が含まれます。この役割の現金報酬給与の範囲は、185,000～240,000ドルです。最終的な提示額は、候補者の経験や専門知識などの複数の要因によって決定され、上記の金額と異なる場合があります。責任 - MLの採用と、MLツールとテクニックの統合に関するサブスタックの考えをリードする - クロスファンクションチームと協力して、製品ロードマップと一致する機械学習の機会を特定して定義する - Pythonと一般的なMLフレームワークを使用して、機械学習モデルを開発、トレーニング、デプロイする - 市販のMLツールとシステムを活用して、サブスタックがML機能を製品とワークフローに取り入れる能力を加速させる - 機械学習モデルとパイプラインを、メインのJavaScript / TypeScriptアプリケーションに統合する - パフォーマンス、スケーラビリティ、効率のために機械学習モデルを最適化して微調整する - データの前処理、特徴量エンジニアリング、モデルトレーニング用のデータパイプラインを設計して実装する - 統合された製品エクスペリエンスと内部ツールをデプロイして所有する要件 - データとMLシステムに関する7年以上の関連経験 - Pythonでの優れたプログラミングスキルと、機械学習で一般的に使用されるPythonライブラリ（例：トランスフォーマーとTensorflow）の経験 - 機械学習アルゴリズム、ディープラーニング、統計モデリングの確かな理解 - 独立して自律的です。当社はマイクロマネジメントするにはあまりにも小さく、同社の全員が自分の仕事を所有し、リーダーになることを期待しています。 - 運用システムに取り組む際には、自分自身と他人を高い基準に保ちます。 - チームに独自の経験とバックグラウンドをもたらしつつ、多様な利害関係者との協力を楽しんでくださいあると望ましい - コードベースに機械学習モデルをシームレスに統合するためのNode.jsとJavaScriptの熟練度 - クラウドプラットフォーム（AWSまたはModalなど）に精通している - 大規模なコンシューマー向けウェブアプリケーションの経験サブスタックは、均等な雇用機会の雇用主です。すべての応募者は、人種、肌の色、宗教、性別（妊娠、性的指向、性別同一性またはトランスジェンダーのステータスを含む）、年齢、国籍、退役軍人または障害のステータスに関係なく、雇用に関して考慮されます。私たちは、独立した表現を可能にし、クリエイター向けのより優れたビジネスモデルを構築することに情熱を注ぐ人々を求めています。広告モデルから外れた場合にメディア、コミュニティ、コンテンツがどのように変化するかを見てみたい、そして貢献するためのスキルと経験をお持ちでしたら、ぜひお会いしたいと思います。

Substack (YC W18) Is Hiring Machine Learning Engineers grnh.se

RSS Hunter • 2024年9月10日

AIとブロックチェーン：相容れない同盟

ブロックチェーンと人工知能（AI）は、多くの分野に革命をもたらす可能性を秘めた、急速に発展する 2 つのテクノロジーです。従来は相容れないものとされてきましたが、それぞれに独自の強みがあります。ブロックチェーンはセキュリティと透明性を提供し、AI は膨大な量のデータを処理してそこから学習することに優れています。ブロックチェーンは、分散的で改ざん防止の記録により、データの整合性を保証し、AI は機械学習と意思決定の力を発揮します。組み合わせることで、ブロックチェーンは AI モデルを暗号化して配布することで保護し、AI の意思決定プロセスを透明化できます。この統合は、ブロックチェーンが AI が使用する機密データへのアクセスを制御することで、プライバシー保護を強化できます。この 2 つのテクノロジーは、物流、金融、ヘルスケア、教育などの産業に革命を起こし、より効率的なシステム、パーソナライズされたサービス、より高いセキュリティを提供できます。法的な懸念から技術的な障壁まで課題は残りますが、ブロックチェーンと AI の融合は、より安全で革新的な未来への有望な一歩となる可能性を秘めています。

AI and Blockchain: An Incompatible Alliance hackernoon.com

RSS Hunter • 2024年9月10日

DBSCAN: 5 分間で理解する

DBSCAN はポイントの密度に基づいてデータ内のクラスターを特定するクラスタリングアルゴリズムであり、ノイズの処理と外れ値の検出に役立ちます。k-means とは異なり、DBSCAN はクラスターの数を事前に指定する必要がありません。これにより、多くの状況で有利になります。このアルゴリズムでは、コアポイントを形成するために必要な半径 (epsilon) と最小近傍の数 (N) という 2 つの重要なパラメータを使用します。コアポイントは近くの近傍と共にクラスターを形成し、これらの基準を満たさないポイントはノイズまたは外れ値としてラベル付けされます。DBSCAN の実装は、ポイント間の距離を計算するための距離関数 (通常はユークリッド距離) から始まります。アルゴリズムはすべてのポイントを反復処理し、互いに近接に基づいてそれらをクラスターにグループ化します。十分な近傍を持たないポイントはノイズとして分類されます。DBSCAN の実装後、同じクラスターを生成する必要がある sklearn ライブラリからの結果と比較することで、パフォーマンスを確認できます。イプシロンと N の値を微調整することが重要です。これらはクラスタリング結果に大きく影響します。この記事では、クラスタリングプロセスを視覚化する合成データの例を示しています。

DBSCAN, Explained in 5 Minutes towardsdatascience.com

RSS Hunter • 2024年9月10日

オープンソースDracarysモデルが生成AIを活用したコーディングを加速

Abacus.aiは、Dracarysレシピによるコーディング用に最適化された微調整されたモデルにより、オープンソースLLMの世界に新しい火を灯しています。

Open source Dracarys models ignite generative AI fired coding venturebeat.com

RSS Hunter • 2024年9月10日

アートガード：生成AIからのオンライン画像保護

Stable Diffusion、Midjourney、DALL-E などの AI モデルのトレーニングにボットがあなたの作品をスクレイピングして使用しないようにするための対策

Art Guard: Protecting Your Online Images From Generative AI towardsdatascience.com

RSS Hunter • 2024年9月10日

Google DeepMindの従業員が米軍と防衛契約に抗議

Google DeepMindの従業員約200名が、同社に軍関連組織との契約を解除するよう求める書簡に署名しました。タイム誌が明らかにした5月16日付の書簡は、AI技術がデジタル兵器として使用されることのエシカルな影響について、組織内で懸念が高まっていることを強調しています。署名者はDeepMindの従業員の約5％を占め、同社のイスラエル軍とのプロジェクト・ニンバスにおけるAIやクラウドコンピューティングサービスの提供に関する契約を指摘しています。Googleの従業員は、AIが戦争で利用されることを懸念している。従業員らは、このような関与は、「全体的な被害」を引き起こしたり、兵器や監視に貢献したりすることを禁止する同社のAI原則に違反していると主張しています。書簡では特定の地政学的紛争については言及されていませんが、イスラエル軍の軍事作戦が監視と標的化にAIを使用していると主張する報告書へのリンクが貼られています。DeepMindは歴史的に軍事目的で技術を使用することに対してポリシーを持っていましたが、2014年に買収されて以来、Googleのより幅広い業務と密接に関わるようになり、軍事契約とのつながりが強まっています。従業員によるDeepMindの技術を軍事クライアントが使用していることを確認し、新しい統治機関を設立するという要求を含めた書簡の要求にもかかわらず、Googleは決定的な行動をとっていません。TechRadar Proは同社にスタッフからの社内書簡についてコメントを求めましたが、すぐに返答はありませんでした。書簡の署名者の一人は、同社のプロジェクト・ニンバスに関する声明が「特に具体性に欠けており、それが実際に何を意味するのか、私たちは皆、見当がつかない」と述べ、TIMEへの苦情に対するGoogleの対応に不満を表明しました。

Google DeepMind workers protest over US military and defense contracts techradar.com

RSS Hunter • 2024年9月10日

SnapDiagram - 手書きの図面をAIを使ってデジタルに変換

SnapDiagramはAIを利用して、手書きのスケッチを簡単に正確にデジタルの図に変換します。

SnapDiagram – Instantly Convert Hand-Drawn Diagrams to Digital with AI snapdiagram.xyz

RSS Hunter • 2024年8月30日

ChatGPT-4 対 Llama 3.1 ― 優れているのはどちらのモデル？

ここ数年、人工知能（AI）は著しい進歩を遂げました。特に、自然言語処理の分野でそうです。数ある AI 言語モデルの中でも、ChatGPT-4 と Llama 3.1 の 2 つが注目を集めています。どちらも人間のような文章を理解して生成するように設計されており、カスタマーサポートからコンテンツ制作まで、さまざまなアプリケーションで役立つツールになります。このブログでは、[…]

ChatGPT-4 vs. Llama 3.1 – Which Model is Better? analyticsvidhya.com

RSS Hunter • 2024年8月30日

AIがCRM業界を変えた方法

自動化はCRMシステムの根幹をなすものであり、販売、マーケティング、カスタマーサービスのチームが繰り返し発生するタスクを効率化することに役立っています。しかし、AIの統合によりCRMの機能は大幅に向上し、リード管理、予測分析、カスタマーサービスなどのプロセスに革命をもたらしました。SalesforceのEinsteinなどのCRMのAIツールは、大量のデータを分析してリードのコンバージョンを予測し、セールスチームが有望な見込み客に焦点を当てることを可能にします。AI主導のチャットボットは、迅速かつパーソナライズされた対応を提供し、必要に応じて複雑なケースを人間のエージェントに転送することにより、カスタマーサービスを向上させます。さらに、AIは顧客の行動を分析し、詳細なバイヤーペルソナを作成することにより、企業が顧客をより深く理解するのに役立ちます。また、AIは履歴とリアルタイムデータを分析して販売実績を予測し、トレンドを特定できるため、販売予測も向上しました。AIによる自動化を強化することにより、CRMシステムは現在、より状況に応じた効率的なタスク自動化を提供し、最終的に生産性を向上させています。こうした進歩にもかかわらず、CRMでAIを確実に実装するためには人間の専門知識が依然として不可欠であり、スキルの向上と新しい才能の採用が求められます。

How Artificial Intelligence Has Changed The CRM Game hackernoon.com

RSS Hunter • 2024年8月29日

このアプリは、AI によって本、記事、PDF をリスンすることができます。

テキスト読み上げ企業である ElevenLabs は、PDF、ePub ファイル、記事などのテキスト読み上げをサポートするリーダーアプリをリリースしました。このアプリでは、ナレーション用のさまざまな AI 音声を選択でき、無料で利用できます。テキスト読み上げ機能は、スマートフォンで最高のアクセシビリティ機能の 1 つです。コンテンツを読み取る代わりに、単にコンテンツを聞きたい場合（たとえば、運転中やランニング中）にも便利です。ありがたいことに、大規模なアップグレードになると約束する新しいリーダーアプリが登場しました。ElevenLabs は、Android および iOS 向けの ElevenLabs Reader アプリの提供を発表し、外出先で何でも聞くことができることを約束しています。より具体的には、PDF、ePub ファイル、テキストファイル、記事、ニュースレター、またはその他のテキストコンテンツを聞くことができると開発者は述べています。ただし、このアプリは Kindle ライブラリをサポートしていないことに注意してください。

This app lets you listen to any book, article or PDF thanks to AI androidauthority.com

RSS Hunter • 2024年8月29日

ジャーノ AI - 時間のかかるタスクを自動化し、ジャーナリストに力を与えます

Journo AI は、調査、起草、レビュー、編集の時間を要するタスクを自動化することで、財務ジャーナリストに超能力を与えます。ルーチンタスクを10〜20分から10〜20秒に短縮し、記述に多くの時間を費やし、エネルギーは高いものの成果の低いタスクに費やす時間を削減できます。

Journo AI - Superpowering journalists by automating time-consuming tasks producthunt.com

RSS Hunter • 2024年8月29日

機械学習に何が行われているのか？最小限のモデル

スティーブン・ウルフラムの記事は、ミニマルモデルを通して機械学習の内部の仕組みを探り、AI の複雑さを簡略化することを目指しています。彼は、ニューラルネットワークが生物学的システムに触発されているものの、数学的な抽象化を使用して動作するという議論から始めます。ウルフラムは、単に結果に焦点を当てるのではなく、機械学習における根本的なプロセスを理解することの重要性を強調しています。彼は、セルオートマを単純なルールからどのように複雑さが生じ得るかを示すための単純なモデルとして使用しています。機械学習をこれらのシステムと比較することにより、ウルフラムは、基礎となるメカニズムを理解することが、AI がどのように機能するかについての洞察を深めることができると示唆しています。また、彼はトレーニングモデルにおけるランダム性と決定論の役割にも触れ、一見予測不可能な行動は、シンプルで決定論的なルールにさかのぼることができるものであると主張しています。ウルフラムは、機械学習の真の性質をよりよく理解するために、新しいパラダイムが必要であることを強調しています。また、現在の AI モデルは理解よりもデータに大きく依存しているという限界についても議論しています。最後に、彼は機械学習を支配する中核的な原則を明らかにするために、ミニマルモデルをさらに探求する必要があるとし、より堅牢で解釈可能な AI システムにつながる可能性があることを述べています。

What's Going on in Machine Learning? Some Minimal Models writings.stephenwolfram.com

RSS Hunter • 2024年8月29日

メッシュ-4は3DモデリングとデザインにSFレベルのAIをもたらします

MeshyはAI搭載の3DモデリングツールであるMeshy-4を発売し、メッシュジオメトリの向上とデザイナーや開発者のための簡素化されたワークフローで、仮想環境の制作に革命を起こします。

Meshy-4 brings sci-fi level AI to 3D modeling and design venturebeat.com

RSS Hunter • 2024年8月29日

ディープマインドの従業員が、グーグルの防衛契約に抗議する書簡に署名

DeepMindの従業員少なくとも200名は、Googleの報告された防衛契約に不満を抱いており、Timeによると、5月に社内で手紙を回覧し、多くのことを語ったとされています。5月16日の手紙には、署名者は「Googleと軍事組織との契約」を懸念していると書かれており、技術に関する記事が引用されています[…]

DeepMind workers sign letter in protest of Google’s defense contracts techcrunch.com

RSS Hunter • 2024年8月29日

安定したAIとMidjourneyを訴えるアーティストの次のステップ

安定性AIとミッドジャーニーに対する集団訴訟に関与するアーティストの一人は、この訴訟によって新しい種類のAIモデルが誕生することを望んでいます。

What’s next for artists suing Stability AI and Midjourney venturebeat.com

RSS Hunter • 2024年8月29日

コード60行で「Train/Fine-Tune Segment Anything 2 (SAM 2)」をトレーニングする/微調整する

Meta社の「SAM2（セグメント・エニシング2）」は、1,100万枚の画像と110億枚のマスクという膨大なデータセットでトレーニングされた汎用的な画像セグメンテーションモデルであり、幅広いセグメンテーションタスクで高い効果を発揮します。SAM2は一般的なオブジェクトをうまくセグメント化できますが、まれなタスクやドメイン固有のタスクでは性能が低下する可能性があり、特定のデータセットの性能を向上させるためにファインチューニングが必要となります。このチュートリアルでは、わずか60行のコードでカスタムタスクのためにSAM2をファインチューニングする方法を概説します。このプロセスには、SAM2のダウンロード、データセットの準備、画像の読み込み、マスクのセグメント化、マスク内のランダムなポイントの選択を行うための簡単なスクリプトの使用が含まれます。ファインチューニングは、マスクデコーダーと（オプションで）プロンプトエンコーダーのトレーニングに重点を置き、画像エンコーダーはフリーズします。このチュートリアルでは、オプティマイザーの設定、混合精度トレーニングの使用、モデルを改良するためのカスタム損失関数を使用したトレーニングループの実行についても説明します。最後のステップには、ファインチューニングされたモデルを保存して、新しい画像で推論に使用し、専門的なセグメンテーションタスクにおけるSAM2の実用的なアプリケーションを示すことが含まれます。

Train/Fine-Tune Segment Anything 2 (SAM 2) in 60 Lines of Code towardsdatascience.com

RSS Hunter • 2024年8月29日

ナプキンの落書きを高芸術に変えるこのAI画像ジェネレーター

## AI画像生成ツールが急速に進化する中、複数のプラットフォームが大幅なアップデートを導入しています。Ideogramは最近、大幅な改良と新機能を搭載したIdeogram 2.0をリリースしました。これには、iOSアプリと、ユーザーが生成した数十億枚を超える画像を検索できる膨大なライブラリが含まれています。このバージョンでは、ユーザーはAIが生成する画像をより細かく制御できるようになり、「リアル」や「デザイン」など、さまざまなスタイルが用意されています。「リアル」は写真のようにリアルな画像を生成し、「デザイン」は画像内のテキストの精度に優れています。その他にも、「3D」「アニメ」「ジェネラル」など、さまざまなクリエイティブなニーズに対応するスタイルが用意されています。Ideogram 2.0では、「マジックプロンプト」と「ディスクライブ」ツールも強化され、より詳細なプロンプトの拡張と画像の説明生成が可能になりました。今回のリリースにはベータ版のAPIも含まれており、DALL-EやFluxが他のプラットフォームに組み込まれているのと同様に、他のアプリとの統合が可能になります。これらのアップデートにより、Ideogram 2.0は、OpenAIのDALL-Eなどの大手と競合することを目指しており、読みやすいテキストを備えた高品質で写真のようにリアルな画像を提供します。

Turn your napkin doodles into high art with this AI image generator techradar.com

RSS Hunter • 2024年8月28日

GoogleがAI Studioに無料の「プロンプトギャラリー」を発表し、開発者ツールを強化

Googleは、AI Studioで無料で利用できるPrompt Galleryをリリースしました。これは、Gemini APIを使用する開発者向けの、多様な事前構築されたプロンプトとツールを使用してAI開発に革命を起こします。

Google debuts free ‘Prompt Gallery’ in AI Studio, supercharging developer tools venturebeat.com

RSS Hunter • 2024年8月27日

Vertex AI の AI21 Labs が Jamba 1.5 モデルファミリーを発表

AI21 Labsは、Google CloudのVertex AI Model Gardenでパブリックプレビューとして利用可能な、Jamba 1.5モデルファミリーを導入しました。このファミリーには2つのモデルが含まれます。カスタマーサポートやテキスト生成などの効率的で軽量なタスク向けに設計されたJamba 1.5 Mini、および財務分析などの高度な推論タスクに優れたJamba 1.5 Largeです。どちらのモデルも256Kのコンテキストウィンドウを備え、Mamba-Transformerアーキテクチャを使用しており、効率的な処理と、関数呼び出し、検索拡張生成（RAG）最適化、構造化JSON出力などの高度な開発者向け機能を提供します。これらのモデルは、カスタマーサービス、財務分析、コンテンツ制作などの領域における企業向けアプリケーションに合わせて調整されています。たとえば、長いドキュメントを要約したり、財務データから洞察を抽出し、高品質のコンテンツを生成したりできます。Jamba 1.5モデルは、Google Cloudのオープンで柔軟なAIエコシステムへの幅広いコミットメントの一部であり、企業ユーザーは自分たちのニーズに最も適したソリューションを構築する機能を提供します。Vertex AIで利用可能なこれらのモデルは、150を超えるモデルを含むプラットフォームの製品を拡大し、ユーザーはプロジェクトに最適なツールを選択できます。Vertex AIは、これらのモデルの簡単な実験、カスタマイズ、展開をサポートし、最適化されたパフォーマンス、コスト管理、安全な展開を可能にします。開発者は、シンプルなAPI呼び出しを介してこれらのモデルにアクセスし、堅牢なセキュリティおよびコンプライアンス機能を提供するGoogle Cloudのマネージドインフラストラクチャを使用して展開できます。Jamba 1.5モデルの利用開始は簡単で、ユーザーはVertex AI Model GardenまたはGoogle Cloud Marketplaceから直接モデルを選択して有効にすることができます。Google Cloudは、AI21 Labsなどのパートナーと協力して最先端のAI機能を提供し続け、開発者がAIテクノロジーの最新の進歩にアクセスできるようにしています。

Announcing the Jamba 1.5 Model Family from AI21 Labs on Vertex AI cloud.google.com

RSS Hunter • 2024年8月27日

文書抽出はGenAIのキラーアプリである

この記事では、複雑なオフィス作業、特に文書抽出の自動化における生成AI（GenAI）の進化と影響について論じています。著者は LinkedIn で機械学習エンジニアとして職務を経験したことを踏まえ、職務内容をさまざまな言語や地域で正確に解釈することは困難な作業だったことを振り返っています。GPT-4 などの大規模言語モデル（LLM）の出現により、履歴書の理解と標準化などの困難な作業は容易になりました。GenAI の真の可能性は文書からインサイトを抽出するオフィスワークの自動化にあります。この作業は世界 GDP のかなりの部分を占めています。例としては、経費管理、医療請求の裁定、融資審査などが挙げられます。LLM は一部のコンテキストで幻覚を起こすことが知られていますが、特定の入力文書に基づいてテキストを推論することに優れています。LLM を使用した文書抽出を成功させる鍵は、クリーンなテキスト変換と堅牢なスキーマ設計であり、一貫した正確な出力を確保します。著者は、複雑な書式や注釈を処理する適切なテキスト抽出の重要性を強調しています。著者らは、ドキュメントの理解における課題に対処するために設計された SaaS ソリューション、Docupanda.io の構築における経験を共有しています。これはクリーンなテキスト表現を生成し、定義済みのスキーマに準拠します。記事では、これらのスキーマの定義が重要であり、AI が反復的なフィードバックを通じてそれらを洗練するのに役立つ可能性があることを強調しています。最後に、著者は文書処理の正規化のための LLM の使用を検討することを推奨し、GenAI の真の「キラーアプリ」は文書ベースのオフィスワークを変換する能力であると示唆しています。

Document Extraction is GenAI’s Killer App towardsdatascience.com

RSS Hunter • 2024年8月27日

AI を使用して広告の作成を自動化する Creatopy が 1,000 万ドルのシリーズ A を調達

このスタートアップ企業はルーマニアで開発されましたが米国に本社を置き、現在は 5,000 を超えるブランドと代理店を顧客に数えます。

Creatopy, which automates ad creation using AI, raises a $10M Series A techcrunch.com

RSS Hunter • 2024年8月26日

AI21がJamba 1.5をデビュー、エージェントAIを実現するハイブリッドSSMトランスフォーマーモデルを強化

Jamba 1.5 mini および Jamba 1.5 largeは、エージェントAIを念頭に置いた、AI21 ハイブリッドSSMトランスフォーマーモデルを強化しています。

AI21 debuts Jamba 1.5, boosting hybrid SSM transformer model to enable agentic AI venturebeat.com

RSS Hunter • 2024年8月26日

ハーモナイゼは、フランチャイザーが構造化されていないデータを理解するために役立てることができるAIエージェントを構築したいと考えています。

一部のビジネスでは、他の会社を買収したり、有機的に拡大したりすることなく成長するための明確な道筋があります。それはフランチャイズです。Statistaによると、米国には80万を超えるフランチャイズビジネスがあり、その数は年々増加すると予測されています。しかし、ビジネスをフランチャイズする（ビジネスモデルとブランドをライセンス供与する […]

Harmonyze wants to build AI agents to help franchisors make sense of unstructured data techcrunch.com

RSS Hunter • 2024年8月26日

システム信頼性の向上:根本原因分析におけるMetaのAI駆動アプローチ

Metaは最近、デバッグ機械学習ワークフローを支援するAIアシスタントのHawkeyeを含む、高度な調査ツールによってシステムの信頼性をどのように強化しているかを共有しました。Metaは、人工知能を統合することで、ヒューリスティックベースの検索と大規模言語モデル(LLM)ランキングを組み合わせ、根本原因分析を支援する新しい調査システムを開発しました。

Advancing System Reliability: Meta's AI-Driven Approach to Root Cause Analysis infoq.com

RSS Hunter • 2024年8月26日

AIベースのERPテストプラットフォームOpkeyが4700万ドルを調達

強固な顧客の注目を集めた (200 以上の巨大企業顧客) スタートアップは、4,700 万ドルのシリーズ B を締めくくりました。

Opkey, an AI-based ERP testing platform, raises $47M techcrunch.com

RSS Hunter • 2024年8月26日

LLM搭載のDevOpsアシスタントClioがリリース、エンジニアのクラウドインフラストラクチャ管理を支援

組織が AI ベースの技術ソリューションを実装することを支援するために設立された企業である Acorn が、最近、エンジニアが DevOps ワークフローを管理するために設計された AI 駆動のコマンドラインアシスタントである Clio を導入しました。ブログ投稿と YouTube のライブストリームで、Acorn は Clio を「少し不機嫌だがフレンドリーなアシスタント」と表現しており、自然言語でさまざまな DevOps 関連タスクを処理できます。

LLM-Powered DevOps Assistant Clio Launches to Help Engineers Manage Cloud Infrastructure infoq.com

RSS Hunter • 2024年8月26日

Codestの新機能を紹介します：FlutterとReact Nativeアプリを生成！

最近のニュースレターで、画像からNextJSアプリを生成するAIツールであるCodestを紹介しました。Codestの成功を基に、研究開発チームはその機能を拡張し、現在は画像からFlutterおよびReact Nativeアプリを生成する機能も追加しました。進捗状況については、以前のブログ記事で2回紹介しましたが、新機能がProof of Concept（PoC）で利用可能になったことを発表することができて嬉しいです。新機能： - Flutterアプリ生成：Codestは、レイアウトとデータを明確に分離した、高品質でモジュール化されたFlutterコードを画像から生成できます。 - React Nativeアプリ生成：Flutterとの統合と同様に、Codestは構造化された再利用可能なReact Nativeコードを生成します。Codestを使用する理由： Codestは、開発時間を最大20％削減することが実証されており、開発者はクリーンでモジュール化されたコードを提供し、モバイルおよびWebアプリの開発プロセスを合理化するのに役立ちます。Codestの動作を紹介する3つの短いビデオをご覧ください。React Native、Flutter、Next.jsの画像から動作するアプリを生成する方法を紹介しています。

Introducing New Features on Codest: Generate Flutter and React Native Apps! dev.to

RSS Hunter • 2024年8月26日

ドリームマシーン1.5がソラと他のライバルのAIビデオメーカーを夢中でキャッチ

Luma LabsがDream Machine 1.5をリリースしてDream Machine AIビデオジェネレータを大幅にアップグレードしました。これにより、リアリズムとユーザープロンプトへの応答性が向上しています。このアップデートは、特にまだSora AIビデオモデルを公開していないOpenAIなど、競合他社に課題をもたらします。Dream Machine 1.5は高速なビデオ生成を実現し、約2分で5秒の高品質ビデオを生成します。また、リアリズムの向上、より滑らかな動き、テキストのレンダリングが向上しました。こうした進歩により、締め切りに追われるコンテンツクリエイターやマーケターにとって貴重なツールとなっています。Runway、Stability AI、ByteDanceのJimengなどの他のAIビデオジェネレータとの競争にもかかわらず、Dream Machine 1.5はその可用性とパフォーマンスにより際立っています。この発売はAIで生成されたビデオのランドスケープにおける重要な進歩となり、エンターテイメント、広告、ジャーナリズムなどの業界を、高品質のビジュアルコンテンツを迅速かつ簡単に作成できるようにすることで変革する可能性を秘めています。

Dream Machine 1.5 Catches Sora and other rival AI video makers napping techradar.com

RSS Hunter • 2024年8月26日

物議を醸している Microsoft の AI 搭載のリコールシステムの予測 ETA がついに発表されました

数週間の遅れを経て、MicrosoftはRecall for Copilot Plus PCsの公開テストが10月に開始されると共有しました。物議を醸しているスクリーンショットマイニングシステムは、最初に発表されたときに厳格なセキュリティとプライバシーの懸念に直面しました。AIと論争は切っても切れない関係にあり、より論争を呼んだ開発の1つは今年初めに発生しました。当時、MicrosoftはRecall for Copilot Plus PCsを導入する計画を明らかにしました。システムは、PCを使用している間ずっとスクリーンショットを撮り続け、AIで画像を処理し、後から参照するためにそれらを検索できるようにします。数か月間の待ちを経て、Microsoftはついに最初の公開テスト参加者を募集する時期を発表しました。Recallはすぐにプライバシー擁護者から懸念の声が上がりました。PCですべての行動を記録するというだけで不必要なプライバシー上の責任が発生するというものでした。誰かがその記録にアクセスできたらどれほど危険であるかを考えてみてください。そして実際に、独立した研究者による初期の分析は、MicrosoftがRecallをどのように実装する予定なのかという不安を煽るだけでした。

Microsoft’s contentious AI-powered Recall system finally has an ETA androidauthority.com

RSS Hunter • 2024年8月26日

McAfeeのディープフェイクディテクターはLenovo AI PCでリアルを維持する

AI を使用して実在する人物を真似るディープフェイク動画は、特に有名人や公人の偽のコンテンツを使って人々を欺くことで、サイバーセキュリティ上の大きなリスクをもたらします。これに対処するために、マカフィーはレノボと提携して、選択したレノボ AI PC 上のディープフェイク動画を特定してフラグを立てるツールであるディープフェイク検出器を導入しました。このツールは 20 万の動画サンプルでトレーニングされており、ニューラル処理ユニット (NPU) を搭載したデバイス上でローカルに動作するため、クラウドアクセスを必要とせずにプライバシーとリアルタイム検出が保証されます。当初、米国、英国、オーストラリアで利用可能だったこの検出器は、新しいレノボ AI PC に 30 日間のトライアル版として含まれており、その後は年間サブスクリプションが 10 ドルです。マカフィーとレノボの協力はデジタルセキュリティの向上を目指していますが、Intel チップに関する排他性は不明です。さらに、マカフィーはマカフィー.ai にスマート AI ハブを提供しており、ユーザーはディープフェイク動画の分析や AI 主導の詐欺に関する情報を取得できます。

McAfee’s Deepfake Detector keeps it real for Lenovo AI PCs techradar.com

RSS Hunter • 2024年8月26日

Bidenの深い偽物詐欺を可能にしたテレコムがFCCに100万ドルを支払う

今年の初め、AIが作成したジョー・バイデン大統領の偽のオーディオがニューハンプシャー州の有権者に届きました。 FCCは速やかに対処し、テキサス州に拠点を置くLife Corporationがこれらの詐欺行為の背後にいることを特定し、数年間にわたり類似の詐欺行為を行ってきた同社と関連する個人に対し600万ドルの罰金を科しました。しかし、詐欺師らはまた、協力者として[…]

Telecom that enabled Biden deepfake scam will pay FCC $1M techcrunch.com

RSS Hunter • 2024年8月26日

「アドビ、「マジックフィックス」をリリース：写真編集の世界におけるAIのブレイクスルー」

「アドビが、ビデオデータから学習して、創造的なワークフローを業界全体に変革し、高度な画像操作を民主化することを目的としたAI搭載の画像編集ツール「マジックフィックスアップ」を発表しました。」

Adobe drops ‘Magic Fixup’: An AI breakthrough in the world of photo editing venturebeat.com

RSS Hunter • 2024年8月26日

「Gmail」の「アシストされた文章作成」機能で、AI を使用してメールの文章を磨けます

Gmail に搭載されている、ジェミニによって提供される「アシスタントによる執筆」というショートカット機能に、Google は同社の AI による執筆支援機能を拡張しています。最新の機能はメールの下書きを洗練し、フォーマルにする「洗練」オプションで、モバイルとウェブの両方のプラットフォームで使用できます。さらに、iOS と Android で 12 語以上のメールを作成する場合、ユーザーは「下書きを洗練」というプロンプトをスワイプして、[洗練]、[フォーマル化]、[詳細化]、[短縮]、[新しい下書きを書く] といったオプションにアクセスできます。これらの機能は、Google One の AI プレミアムプランのサブスクライバー、または教育やビジネス向けの特定のジェミニアドオンを導入している組織だけが利用できます。しかし、これらのツールの実際性と効率性には懐疑的な見方があり、時間節約やメールコミュニケーションの質の向上に実際に役立つか疑問視する声も上がっています。

Gmail’s ‘Help Me Write’ Feature Can Now Polish Up Your Emails With AI lifehacker.com

RSS Hunter • 2024年8月26日

イデオグラム 2.0 の実践：信じられないほど見栄えのよいテキストを作成する AI

イデオグラム2.0は、テキスト表示、カラーオプションの向上、価格の低減によりAI画像作成を改善し、大御所を挑発し、デジタルコンテンツの作成方法を変えます。

Hands-on with Ideogram 2.0: The AI that makes text look incredible venturebeat.com

RSS Hunter • 2024年8月26日

D-ID、ボイスクローニングとリップシンク機能を含むAIビデオ変換ツールを発表

AI動画作成プラットフォームであるD-IDは、最新のテクノロジーを使用し、動画を別の言語に翻訳するツールの出荷を開始した最新企業です。しかし、この場合、D-IDは話者の声も複製し、AI編集プロセスの一環として唇の動きを翻訳された単語に合わせて変更します。このテクノロジーは、D-IDの以前の[…]から派生しています。

D-ID launches an AI video translation tool that includes voice cloning and lip sync techcrunch.com

RSS Hunter • 2024年8月26日

Midjourney が全ユーザー向けに Web サイトを開設し、25 個の無料 AI 画像生成を提供

Midjourney が Elon Musk の xAI や Grok 2、Ideogram 2 といった類似サービスとの競争激化に直面している中での発表です。

Midjourney opens website to all users, offering 25 free AI image generations venturebeat.com

RSS Hunter • 2024年8月26日

AnthropicのClaudeがモバイルアプリ収益で100万ドルを上回る

しかし、ClaudeはまだトップライバルのChatGPTよりも大幅に遅れをとっています。

Anthropic’s Claude surpasses $1M in mobile app revenue techcrunch.com

RSS Hunter • 2024年8月26日

次のオフィスプレゼンテーションのための7つのAI PPTメーカー

あなたは、大学の最終学年で卒業プロジェクトを際立たせるように努力しているかもしれないし、日常の会議とクライアントとのプレゼンテーションの要求に応えるように奮闘するプロフェッショナルかもしれない。両シナリオとも、プロフェッショナルな設定か個人的な遭遇かにかかわらず、強い第一印象がどれほど重要かを理解している。デザインされた[…]

7 AI PPT Makers For Your Next Office Presentation analyticsvidhya.com

RSS Hunter • 2024年8月25日

Cloud Run上でNVIDIA GPUsを使用してAI推論アプリケーションを実行する

Google Cloudは、Cloud RunでNVIDIA L4 GPUサポートをプレビューで導入しました。これにより、開発者は、GoogleのGemmaやMetaのLlamaのようなオープンな生成AIモデルを使用するアプリケーションで、リアルタイムAI推論を簡単に行えるようになりました。このアップグレードは、カスタムチャットボット、文書要約、画像認識、3Dレンダリングなどのタスクに使用される軽量モデルや、計算リソースが多く必要なアプリケーションにとって特に有益です。この新機能で、開発者は、AI推論プロセスを高速化するNVIDIA GPUsを使用して、低遅延と効率的なスケーリングを提供し、Cloud Runのインフラストラクチャーが基盤の複雑さを管理します。早期の採用者、L’OrealやChaptrは、GPUの統合がスタートアップ時間が短く、スケーラビリティが高く、使いやすいと評価しています。GPUサポートは現在、US-central1リージョンで利用可能で、今年までにヨーロッパとアジアにも拡大予定です。Cloud Run上でNVIDIA GPUsを使用したサービスをデプロイするには、開発者は、コマンドラインやGoogle Cloudコンソールを介してGPUの要件を指定できます。さらに、Cloud Runは今、GPUアタッチメントを持つ関数もサポートし、イベント駆動のAI推論タスクを簡単化します。

Run your AI inference applications on Cloud Run with NVIDIA GPUs cloud.google.com

RSS Hunter • 2024年8月25日

Openmartは、企業が地元のビジネスに売り込むことをより簡単にすることを目指しています

2020年、Kathryn WuはPinterestの製品エンジニアとして働いていたときにサイドハッスルを始めました。Wuは、OhTeaというミルクティー会社を立ち上げ、地元のスーパーマーケットやギフトショップと連携し、ティーを販売してもらえるようにすることを目指しました。彼女はすぐに、地元のスーパーマーケットやギフトショップと連携することがどれほど困難かを悟りました[…]

Openmart wants to make it easier for enterprises to sell to local businesses techcrunch.com

RSS Hunter • 2024年8月25日

LambdaTestがソフトウェアのエンドツーエンドテスト用のKaneAIエージェントを発売

LambdaTestによると、KaneAIは、AIエージェントが多数存在するコーディングの分野で、唯一の差別化要因として、ユーザーが単一のプラットフォーム上でテストの全過程を管理できるようにする。

LambdaTest launches KaneAI agent for end-to-end software testing venturebeat.com

RSS Hunter • 2024年8月25日

Skyfireが発売し、自律的なAIエージェントがあなたの代わりにお金を支払えるようにする

Skyfireは、AIエージェントとLLM（大規模言語モデル）間で完全に自律的な取引をサポートする世界初の支払いネットワークを提供していると主張しています。

Skyfire launches to let autonomous AI agents spend money on your behalf venturebeat.com

RSS Hunter • 2024年8月25日