简体中文版人工智能和 ML 新闻 - TheNote.app

简体中文版人工智能和 ML 新闻
关注

“AI & ML 新闻 "是以人工智能和机器学习为重点的技术说明集。它收集了人工智能和 ML 最新发展的时事新闻和评论。该新闻源涵盖了广泛的主题，包括新算法、应用和研究。它强调了行业趋势以及人工智能和 ML 对各经济领域的影响。资料涉及神经网络、深度学习和自然语言处理等领域。还研究了人工智能在医疗保健、金融和其他行业的应用实例。这些出版物对专家--开发人员和数据分析师，以及对人工智能技术发展感兴趣的任何人都有意义。人工智能伦理和数据隐私问题也在讨论之列。新闻联播向读者介绍了人工智能市场的主要参与者--从大型公司到前途无量的初创企业。还介绍了有关人工智能系统开发工具和平台的信息。 “AI & ML News "旨在提供有关人工智能和机器学习发展的客观和最新信息。

RSS Hunter • 2024年7月27日

笔记线程

变形金刚：注意力的时代

2017年，研究人员在论文“Attention is All You Need”中提出了Transformer模型，彻底改变了自然语言处理（NLP）。早期的RNN和LSTM等模型顺序处理单词，这限制了它们处理长句子的能力，降低了训练速度，并妨碍了并行处理。Transformer通过使用自注意力解决了这些问题，它允许模型关注句子中任何位置的重要单词。这使Transformer变得更快、更具可扩展性，特别是通过利用并行化。它消除了顺序单词处理的需要，提高了对单词之间复杂关系的理解。该模型的编码器-解码器架构有效地将输入序列处理成翻译等输出。多头注意力等关键功能允许模型同时捕获句子中含义的不同方面。解码器通过只关注前面的单词逐步生成翻译，确保准确性。该架构已成为BERT和GPT等许多最先进模型的基础，极大地提高了各种NLP任务的性能。

Transformers: Age of Attention hackernoon.com

RSS Hunter • 2024年9月13日

使用 NLP、BigQuery 和嵌入的多模态搜索解决方案

该博客讨论了搜索技术超越文本的进步，通过多模式嵌入将图像和视频纳入搜索功能。传统的企业搜索引擎是为基于文本的查询设计的，这限制了它们处理视觉内容的能力。通过整合自然语言处理 (NLP) 和多模态嵌入，现在可以执行跨模式语义搜索，让用户可以像使用文本一样搜索图像和视频。该博客演示了一个系统，该系统可以通过使用 Google Cloud Storage 存储媒体，通过 BigQuery 进行索引，执行文本到图像、文本到视频和组合搜索。多模态嵌入模型用于生成媒体文件的嵌入，从而实现高效的相似性搜索。该架构支持无缝的跨模式搜索体验，让内容发现更直观。用户的文本输入会转换为嵌入，然后执行一个向量搜索，将查询与已存储的媒体数据匹配。最后，向用户展示结果，其中包括最相关的图像或视频 URI 及其相似性得分。这种方法可以增强搜索体验，为搜索视觉内容解锁新的可能性。

A multimodal search solution using NLP, BigQuery and embeddings cloud.google.com

RSS Hunter • 2024年9月12日

2024 年机器学习中必须知道的 10 大 Python 库

随着我们进入2024年，机器学习（ML）正在快速发展。Python凭借其丰富的库生态系统，仍然处于ML开发的前沿。在这篇文章中，我们将探讨2024年主导ML领域的十大Python库，以及自2020年以来该领域的变化，以及关键的[...]。

10 Must-Know Python Libraries for Machine Learning in 2024 machinelearningmastery.com

RSS Hunter • 2024年9月12日

由人工智能驱动的 GitHub README 生成器

人工智能驱动的自述文件生成器是一个新工具，旨在帮助开发者为他们的 GitHub 项目创建高质量自述文件。该工具通过使用基本项目信息生成结构化、专业外观的自述文件来简化文档流程。它以 GitHub 风格的 Markdown 提供智能格式，并提供适合不同项目类型的各种模板。该工具还会根据项目性质建议相关章节，并增强语言的清晰度和参与度。通过使用该工具，开发者可以节省时间，提高项目可见性，并确保其文档清晰、简洁和一致。它支持从头创建新的自述文件或通过分析当前内容和建议改进内容来优化现有的自述文件。用户可以查看和自定义生成的内容以满足其项目的需要，然后将其提交到其 GitHub 仓库，以便其他人更容易理解和参与项目。总而言之，这是一个有效的方法，可以增强协作并更专业地展示项目。

AI-Powered GitHub README Generator dev.to

RSS Hunter • 2024年9月12日

提升机器学习技能：免费数学和统计课程

想要进入机器学习的世界却觉得数学和统计学让自己无所适从？别担心，你并不是孤身一人！很多有抱负的数据科学家发现这些课题望而生畏。好消息是，网上有很多免费课程，可以帮助你建立坚实的基础。Coursera：斯坦福大学机器学习课程：这门传奇的课程不仅可以帮你了解机器学习的概念，还可以提供强有力的数学基础。伦敦帝国理工学院机器学习数学：如果你希望深入了解数学概念，这门课程是一个很好的选择。edX：微软机器学习入门：这门课程提供了一种平衡的方法，它将机器学习的基础知识与必要的数学知识相结合。哥伦比亚大学数据科学基础：这门课程以一种更广泛的视角来阐述数据科学，包括统计学和机器学习。麻省理工学院开放课程：算法导论：虽然这门课程并不是专门讲授机器学习的，但它为算法和数据结构奠定了坚实的基础，这对于理解机器学习的概念至关重要。概率和随机变量：深入理解概率论对于了解很多机器学习算法来说至关重要。可汗学院：线性代数：学习线性代数的综合资源，这是机器学习中的一个基本课题。微积分：另一个至关重要的数学概念，微积分在可汗学院中有详细介绍。统计学和概率论：扎实地理解统计学和概率论对于数据分析和机器学习至关重要。请记住：虽然这些课程提供了有价值的资源，但坚持不懈的练习和动手操作经验才是掌握这些课题的关键。从基础开始，随着信心的增强，逐渐增加复杂度。只要持之以恒并掌握正确的资源，你很快就能成为一名熟练的机器学习从业人员。学习愉快！

Boost Your Machine Learning Skills: Free Courses for Math and Statistics dev.to

RSS Hunter • 2024年9月10日

坂田AI的“AI科学家”：下一个爱因斯坦还是仅仅一个工具？

在人工智能领域，一项突破性的发展已经出现，它有望重塑科学发现的过程。坂那 AI 与牛津大学 Foerster 人工智能研究实验室以及不列颠哥伦比亚大学的研究人员合作，推出了“人工智能科学家”——一个全面系统，旨在完全 […]

Sakana AI’s “AI Scientist”: The Next Einstein or Just a Tool? analyticsvidhya.com

RSS Hunter • 2024年9月10日

使用 Open CV 和 Python 的手语检测：手势识别

用手势识别使用OpenCV和Python我已经创建了一个YouTube视频来演示使用OpenCV和Python的手势识别程序，它可以检测手势语言！✋🤖在这个项目中，我做了以下事情： - 为计算机视觉设置OpenCV和Python - 捕捉和处理实时视频输入 - 实施机器学习用于手势识别 - 检测和翻译手势语言

Sign Language Detector with Open CV and Python: Hand Gesture Recognition dev.to

RSS Hunter • 2024年9月10日

今年欧洲最热门的人工智能交易

2024 年，欧洲人工智能行业在风险投资中表现出显著的韧性，截至 8 月，有 14 项投资超过 1 亿美元。这与初创企业普遍面临的融资困境形成了鲜明对比。值得注意的是，人工智能已成为一个强劲的投资领域，这由开发人工智能技术的高昂成本和人才激烈竞争所推动。欧洲今年人工智能领域最值得关注的交易包括：- Wayve：这家总部位于剑桥的初创公司筹集了 10.5 亿美元，用于提升其自动驾驶技术，标志着欧洲人工智能公司单笔融资额度的最高纪录。Wayve 专注于向汽车制造商出售其人工智能技术，而不是自己生产汽车。 - Mistral：Mistral 是大型语言模型构建领域中的杰出者，已通过两笔重要的融资（4.31 亿美元和 6.5 亿美元）筹集了超过 10 亿美元的资金。该公司强调开源技术，吸引着企业和开发者。 - Helsing：这家德国初创公司专注于国防应用方面的人工智能，已获得 4.84 亿美元的融资。其技术旨在增强防御系统和能力，尤其是在欧洲地缘政治紧张的背景下。 - Poolside：Poolside 面向软件开发者，筹集了 4 亿美元，用于开发人工智能工具以简化软件开发流程。 - DeepL：以人工智能驱动的翻译服务而闻名的 DeepL 筹集了 3.2 亿美元，专注于拥有约 100,000 家企业客户的 B2B 市场。 - H：这家初创公司的前身是 Holistic AI，以种子轮融资筹集了 2.2 亿美元，旨在开发用于任务自动化和决策的 AI 代理。 - Flo Health：这款总部位于伦敦的女性健康应用程序筹集了 2 亿美元，成为第一款估值超过 10 亿美元的纯数字健康应用程序。 - Pigment：这家巴黎初创公司提供企业资源规划解决方案，筹集了 1.45 亿美元，将其产品与人工智能相集成。总体而言，欧洲的人工智能格局的特点是大规模融资和对基础技术的关注，像巴黎这样的城市正成为人工智能开发的重要中心。

The top AI deals in Europe this year techcrunch.com

RSS Hunter • 2024年9月10日

Substack（YC W18）正在招聘机器学习工程师

概述作为 Substack 的机器学习工程师，你将在开发和实施尖端机器学习解决方案以增强我们的产品服务中发挥至关重要的作用。你将加入一个充满活力的团队，与软件工程师和数据科学家紧密合作，将机器学习模型引入我们的代码库，并将它们无缝集成到我们的产品中。该职位提供了一个塑造我们技术堆栈的未来并产生重大影响的绝佳机会。Substack 的薪酬待遇包括具有市场竞争力的薪酬、所有全职职位的股权，以及非凡的福利。该职位的现金报酬薪酬范围为 185,000 美元 - 240,000 美元。最终的要约金额由多个因素决定，包括候选人的经验和专业知识，可能与上述金额不同。职责 - 领导 Substack 关于 ML 采用以及 ML 工具和技术的集成的思考 - 与跨职能团队合作，识别和定义与我们的产品路线图一致的机器学习机会 - 使用 Python 和流行的 ML 框架开发、训练和部署机器学习模型 - 充分利用现成的 ML 工具和系统，以加速 Substack 将 ML 功能纳入其产品和工作流程的能力 - 将机器学习模型和管道集成到我们的主 JavaScript / TypeScript 应用程序中 - 针对性能、可扩展性和效率优化和微调 ML 模型 - 设计和实施用于数据预处理、特征工程和模型训练的数据管道 - 部署和拥有集成的产品体验和内部工具要求 - 在数据和机器学习系统方面拥有 7 年以上的相关经验 - 精通 Python 编程，并具备在机器学习中常用的 Python 库的经验（例如 Transformers 和 Tensorflow） - 扎实的机器学习算法、深度学习和统计建模基础 - 独立自主。我们的公司规模较小，无暇进行微观管理，我们希望公司中的每个人都能负责自己的工作，并且能够成为领导者。 - 在处理生产系统时，对自己和他人要求严格。 - 在与利益相关者的多元化群体合作的同时，还能为团队带来你独特的经验和背景额外要求 - 精通 Node.js 和 JavaScript，以便将机器学习模型无缝集成到我们的代码库中 - 熟悉云平台（例如 AWS 或 Modal） - 具备大规模处理消费者网络应用程序的经验Substack 是机会均等的雇主。我们将考虑所有求职者的就业资格，不分种族、肤色、宗教、性别（包括怀孕、性取向、性别认同或跨性别状态）、年龄、国籍、退伍军人或残疾状况。我们正在寻找热爱支持独立表达和为创作者构建更好商业模式的人。如果你希望了解媒体、社区和内容在摆脱广告模式后可以变成什么样，并且具备相关的技能和经验，我们很乐意与你见面。

Substack (YC W18) Is Hiring Machine Learning Engineers grnh.se

RSS Hunter • 2024年9月10日

人工智能和区块链：势不两立的联盟

区块链和人工智能 (AI) 都是两项快速发展的技术，有可能彻底改革诸多行业。虽然传统观念认为它们互不兼容，但它们提供着独一无二的优势：区块链提供安全和透明性，而 AI 则擅长处理海量数据并从中学习。区块链通过去中心化、防篡改记录确保数据的完整性，而 AI 则带来了机器学习和决策的力量。结合起来时，区块链可以通过加密和分发 AI 模型来保护它们的安全，同时还在 AI 的决策过程中提供透明性。这种整合可以通过区块链控制 AI 使用的敏感数据访问来增强隐私保护。这两项技术可以彻底改变物流、金融、医疗保健和教育等行业，提供更加高效的系统、个性化服务以及更高的安全性。虽然仍然存在挑战，包括法律问题和技术壁垒，但区块链和 AI 的综合运用带来的潜在利益让它成为了迈向更加安全和创新的未来的一个有前途的步骤。

AI and Blockchain: An Incompatible Alliance hackernoon.com

RSS Hunter • 2024年9月10日

DBSCAN，5 分钟搞懂

DBSCAN 是一种根据点密度识别数据中聚类的聚类算法，这使其在处理噪声和检测离群点方面非常有用。与 k 均值不同，DBSCAN 无需预先指定聚类的数量，这使其在许多情况下都具有优势。该算法使用两个关键参数：半径（epsilon）和形成核心点的所需最小邻域数 (N)。核心点及其附近的邻域会形成聚类，而那些不满足这些条件的点则会被标记为噪声或离群点。DBSCAN 的实施从距离函数（通常为欧几里得距离）开始，以计算点之间的距离。该算法对所有点进行迭代，根据彼此的邻近度将它们分组为聚类。没有足够邻域的点被归类为噪声。在实施 DBSCAN 后，可以通过将其与 sklearn 库中的结果进行比较来检查其性能，这应该会生成相同的聚类。对 epsilon 和 N 值进行微调非常重要，因为它们极大地影响聚类结果。本文提供了一个带合成数据的示例，用于可视化聚类过程。

DBSCAN, Explained in 5 Minutes towardsdatascience.com

RSS Hunter • 2024年9月10日

开源 Dracarys 模型点燃生成式 AI 驱动的编程

Abacus.ai 正通过使用 Dracarys 配方针对编码进行微调的优化模型，为开源 LLM 世界带来了新火种。

Open source Dracarys models ignite generative AI fired coding venturebeat.com

RSS Hunter • 2024年9月10日

美术卫士：保护您的在线图片免受生成式 AI 侵害

防止机器人抓取并利用您的艺术作品来训练 Stable Diffusion、Midjourney 和 DALL-E 等 AI 模型的步骤

Art Guard: Protecting Your Online Images From Generative AI towardsdatascience.com

RSS Hunter • 2024年9月10日

谷歌 DeepMind 员工抗议美国军事和国防合同

谷歌人工智能研究部门 DeepMind 的近 200 名员工签署了一封信，敦促该公司终止与军事组织的合同。《时代》杂志披露的 5 月 16 日信件强调了组织内部对该公司的 AI 技术被用于数字战争的道德影响的日益担忧。签名者代表了 DeepMind 约 5% 的员工，批评该公司与包括以色列军方在内的各个政府签订合同，根据“Nimbus 计划”向其提供 AI 和云计算服务。谷歌员工担心他们的 AI 被用于战争。员工认为，这种参与违反了谷歌自己的 AI 原则，该原则规定公司不会追求会导致“总体危害”或有助于武器和监视的 AI 应用。虽然这封信没有提到任何具体的地缘政治冲突，但它链接到声称以色列军事行动正在使用 AI 进行监视和瞄准的报告。尽管 DeepMind 一直坚持不将自己的技术用于军事目的，但自 2014 年被收购以来，该业务已与 Google 的更广泛业务变得越来越密切，导致与军事合同联系更紧密。尽管信中提出了要求，包括审查 DeepMind 的技术被军事客户使用的过程和成立一个新的管理机构，但谷歌尚未采取任何决定性行动。TechRadar Pro 已要求该公司对员工的内部信函发表评论，但我们并未立即收到答复。该信的签署者之一向《时代》杂志表达了他们对谷歌对该投诉的答复的不满，称该公司对“Nimbus 计划”的声明“非常不具体，我们都不知道这实际上意味着什么”。

Google DeepMind workers protest over US military and defense contracts techradar.com

RSS Hunter • 2024年9月10日

SnapDiagram - 即刻利用人工智能将手绘图表转变成数字格式

SnapDiagram 利用人工智能轻松而准确地将手绘草图转换成数字图表。

SnapDiagram – Instantly Convert Hand-Drawn Diagrams to Digital with AI snapdiagram.xyz

RSS Hunter • 2024年8月30日

ChatGPT-4 vs. Llama 3.1——哪个模型更好？

近年来，人工智能取得了显著进展，特别是在自然语言处理方面。在众多人工智能语言模型中，有两个引起了广泛关注：ChatGPT-4 和 Llama 3.1。两者都被设计为理解并生成类似人类的文本，使其成为从客户支持到内容创作等各种应用的宝贵工具。在本博客中，我们 […]

ChatGPT-4 vs. Llama 3.1 – Which Model is Better? analyticsvidhya.com

RSS Hunter • 2024年8月30日

人工智能如何改变 CRM 格局

自动化一直是 CRM 系统的基石，可以帮助销售、营销和客户服务团队简化重复性任务。但是，人工智能的整合显著增强了 CRM 的能力，彻底改变了潜在客户管理、预测性分析和客户服务等过程。CRM 中的 AI 工具，比如 Salesforce 的 Einstein，可以分析海量数据以预测潜在客户转换，这能让销售团队专注于高潜力的潜在客户。人工智能驱动的聊天机器人改进了客户服务，可以通过提供快速、个性化的响应，并在必要时将复杂案例转到人工坐席。此外，人工智能通过分析客户行为和创建详细的买方角色，可以帮助企业更好地了解其受众。销售预测也得到了改进，因为人工智能可以分析历史数据和实时数据来预测销售结果并识别趋势。通过使用人工智能增强自动化，CRM 系统现在可以针对具体情况提供更有效的任务自动化，最终提高生产力。尽管有这些进步，但对于 CRM 中 AI 的成功实施，人类专业知识仍然至关重要，强调了提高技能和招聘新人才的必要性。

How Artificial Intelligence Has Changed The CRM Game hackernoon.com

RSS Hunter • 2024年8月29日

此应用程序借助 AI 让你可以聆听任何书籍、文章或 PDF

语音合成公司 ElevenLabs 发布了一款阅读器应用，它为 PDF、ePub 文件、文章等内容提供语音合成支持。这款应用可让你从各种 AI 声音中选择用于朗读的声音，而且免费使用。语音合成功能是智能手机上最好的无障碍功能之一。如果你只想收听内容而不阅读内容（例如在开车或跑步时），它也非常方便。值得庆幸的是，现在有一款新的阅读器应用，它有望成为一项重大升级。ElevenLabs 宣布 ElevenLabs 阅读器应用现已适用于 Android 和 iOS，保证让你随时收听任何内容。更具体地说，开发人员表示你可以收听 PDF、ePub 文件、文本文件、文章、时事通讯或其他文本内容。但是，值得注意的是，这款应用不支持你的 Kindle 图书馆。

This app lets you listen to any book, article or PDF thanks to AI androidauthority.com

RSS Hunter • 2024年8月29日

Journo AI - 通过自动化耗时的任务为记者赋能

Journo AI 为金融记者赋能，实现研究、起草、审查和编辑等耗时任务的自动化。将常规任务从 10-20 分钟缩减至 10-20 秒，从而节省更多写作时间，减少高能量、低回报任务所消耗的时间。

Journo AI - Superpowering journalists by automating time-consuming tasks producthunt.com

RSS Hunter • 2024年8月29日

机器学习中在发生什么？一些最小模型

史蒂芬·沃尔夫勒姆的文章通过极简模型探讨机器学习的内部运作，旨在简化人工智能的复杂性。他首先讨论神经网络如何受到生物系统的启发，但使用数学抽象进行操作。沃尔夫勒姆强调了理解机器学习中的基本过程而不是仅仅关注结果的重要性。他使用元胞自动机作为简单模型来说明复杂性如何源于简单规则。通过将机器学习与这些系统进行比较，沃尔夫勒姆表明了解基础机制可以更好地洞察人工智能是如何工作的。他还提到了随机性和确定性在训练模型中的作用，认为看似不可预测的行为可以追溯到简单、确定的规则。沃尔夫勒姆强调需要新的范例来更好地理解机器学习的真实本质。他还讨论了当前人工智能模型的局限性，这些模型通常严重依赖数据而不是理解。最后，他呼吁更深入地探索极简模型，以揭示支配机器学习的核心原理，这可能会带来更健壮、更可解释的人工智能系统。

What's Going on in Machine Learning? Some Minimal Models writings.stephenwolfram.com

RSS Hunter • 2024年8月29日

Mesh-4 将科幻级别的 AI 带入 3D 建模和设计

Meshy 推出 Meshy-4，这是一款先进的 AI 驱动的 3D 建模工具，通过改进的网格几何形状和针对设计师和开发者的流线化工作流程，彻底改变虚拟环境创建。

Meshy-4 brings sci-fi level AI to 3D modeling and design venturebeat.com

RSS Hunter • 2024年8月29日

DeepMind 员工签署信件以抗议 Google 的国防合同

谷歌人工智能研发部门 DeepMind 至少有 200 名员工对谷歌报告的国防合同表示不满——据《时代》杂志报道，他们早在今年 5 月份就在内部发起了联名信以表述这一观点。这封信的日期是 5 月 16 日，信中表示，签署者对“谷歌与军事组织的合同”表示担忧，并援引了一些文章谈及科技 […]

DeepMind workers sign letter in protest of Google’s defense contracts techcrunch.com

RSS Hunter • 2024年8月29日

对 Stability AI 和 Midjourney 提起诉讼的艺术家接下来将采取什么行动

参与对 Stability AI 和 Midjourney 提起集体诉讼的艺术家之一希望该诉讼将开启一种新型 AI 模型。

What’s next for artists suing Stability AI and Midjourney venturebeat.com

RSS Hunter • 2024年8月29日

使用 60 行代码训练/微调 Segment Anything 2 (SAM 2)

元模型公司开发的“SAM2（任意分段 2）”是一款通用的图像分割模型，它经过训练处理一个包含 1100 万张图像和 110 亿个掩码的庞大数据集，因此对于各种分割任务具有非常高的效率。虽然 SAM2 能够很好地分割常见对象，但它可能在罕见的或特定领域的 task 中表现不佳，因此需要进行微调以提高对特定数据集的性能。本教程概述了如何使用仅 60 行代码针对自定义 task 对 SAM2 进行微调。这个过程涉及下载 SAM2，准备一个数据集，并使用一个简单的脚本来加载图像，分割掩码，并在这些掩码中选择随机点。微调专注于训练掩码解码器，还可以选择提示编码器，同时冻结图像编码器。本教程还涵盖了设置优化器，使用混合精度训练，以及使用自定义损失函数运行训练循环以优化模型。最后一步包括保存经过微调的模型，并使用它对新图像进行推理，展示了 SAM2 在特殊分割任务中的实际应用。

Train/Fine-Tune Segment Anything 2 (SAM 2) in 60 Lines of Code towardsdatascience.com

RSS Hunter • 2024年8月29日

用这个AI图像生成器将你的餐巾纸涂鸦变成高艺术

人工智能图像生成器正在快速发展，多个平台都推出了主要更新。Ideogram最近推出了Ideogram 2.0，具有显著改进和新功能，包括iOS应用程序和一个庞大的可搜索库，拥有超过10亿用户生成的图像。该版本为用户提供了对AI生成图像的更大控制权，有多种不同的风格，如Realistic，可以生成逼真的图像；Design，则在图像中的文本准确性方面出类拔萃。其他风格还包括3D、Anime和General，每种都满足不同的创作需求。Ideogram 2.0还增强了Magic Prompt和Describe工具，使提示扩展和图像描述生成更加详细。该版本还包括一个beta API，允许与其他应用程序集成，就像DALL-E和Flux嵌入到其他平台一样。随着这些更新，Ideogram 2.0旨在与主要玩家OpenAI的DALL-E竞争，承诺提供高质量、逼真的图像和可读的文本。

Turn your napkin doodles into high art with this AI image generator techradar.com

RSS Hunter • 2024年8月28日

谷歌在 AI Studio 推出免费的‘提示库’，增强开发者工具

谷歌在 AI Studio 中推出免费提示库，用 Gemini API 为开发者提供多样化的预建提示和工具，从而彻底改变了 AI 开发。

Google debuts free ‘Prompt Gallery’ in AI Studio, supercharging developer tools venturebeat.com

RSS Hunter • 2024年8月27日

宣布 AI21 Labs 在 Vertex AI 上推出 Jamba 1.5 模型系列

AI21 Labs 推出了 Jamba 1.5 模型系列，现已在 Google Cloud 的 Vertex AI Model Garden 公测。该系列包括两个模型：专为客户支持和文本生成等高效轻量级任务设计的 Jamba 1.5 Mini，以及擅长金融分析等高级推理任务的 Jamba 1.5 Large。这两个模型都具有 256K 上下文窗口，并使用 Mamba-Transformer 架构，提供了高效的处理和高级开发人员功能，例如函数调用、检索增强生成 (RAG) 优化和结构化 JSON 输出。这些模型是为企业应用程序量身定制的，尤其是在客户服务、金融分析和内容创建等领域。例如，它们可以总结冗长的文档、从财务数据中提取见解并生成高质量的内容。Jamba 1.5 模型是 Google Cloud 致力于开放和灵活的 AI 生态系统的更广泛承诺的一部分，它使用户能够构建最能满足他们需求的解决方案。这些模型在 Vertex AI 上可用，扩展了该平台的产品，其中包括 150 多个模型，使用户能够为自己的项目选择最佳工具。Vertex AI 支持对这些模型进行简单的试验、自定义和部署，从而可以实现优化性能、成本管理和安全部署。开发人员可以通过简单的 API 调用访问这些模型，并使用 Google Cloud 的托管基础架构（提供强大的安全性和合规性功能）部署这些模型。开始使用 Jamba 1.5 模型非常简单，用户可以直接从 Vertex AI Model Garden 或 Google Cloud Marketplace 中选择并启用模型。Google Cloud 继续与 AI21 Labs 等合作伙伴合作，提供尖端的 AI 功能，确保开发人员能够使用 AI 技术的最新进展。

Announcing the Jamba 1.5 Model Family from AI21 Labs on Vertex AI cloud.google.com

RSS Hunter • 2024年8月27日

文档提取是生成式人工智能的杀手级应用

这篇文章探讨了生成式人工智能（GenAI）在自动化复杂办公任务，尤其是文档信息提取方面的演变和影响。作者回顾了自己作为领英机器学习工程师的经历，当时跨语言和地区准确解释职位名称是一项极具挑战性的任务。随着 GPT-4 等大型语言模型 (LLM) 的出现，曾经很困难的任务，例如理解和标准化简历，现在变得轻而易举。生成式人工智能的真正潜力在于自动化涉及从文档中提取见解的办公工作，这类工作占全球 GDP 的很大一部分。例子包括费用管理、医疗保健索赔判定和贷款承销。尽管众所周知，大型语言模型在某些情况下会出现“幻觉”，但在基于特定输入文档进行文本推理方面，它们表现出色。使用大型语言模型成功进行文档信息提取的关键是干净的文本转换和强大的模式设计，这确保了输出的一致性和准确性。作者强调了正确文本提取的重要性，其中涉及处理复杂的格式和注释。他们分享了自己构建 Docupanda.io 的经验，Docupanda.io 是一个 SaaS 解决方案，旨在通过生成干净的文本表示并遵循预定义的模式来解决文档理解方面的挑战。文章强调，定义这些模式至关重要，人工智能可以通过迭代反馈帮助完善它们。最后，作者鼓励探索使用大型语言模型来规范文档处理，并表示生成式人工智能真正的“杀手级应用”是其转变基于文档的办公工作的能力。

Document Extraction is GenAI’s Killer App towardsdatascience.com

RSS Hunter • 2024年8月27日

使用人工智能进行广告创建自动化的 Creatopy 融资 1000 万美元 A 轮

这家在罗马尼亚开发、但是总部在美国的公司目前拥有 5,000 多家品牌和代理作为客户。

Creatopy, which automates ad creation using AI, raises a $10M Series A techcrunch.com

RSS Hunter • 2024年8月26日

AI21 推出 Jamba 1.5，对混合 SSM 变压器模型进行提升，以实现代理 AI

Jamba 1.5 mini 和 Jamba 1.5 large 是一款高级 AI21 混合 SSM transformer 模型，着眼于 agent AI。

AI21 debuts Jamba 1.5, boosting hybrid SSM transformer model to enable agentic AI venturebeat.com

RSS Hunter • 2024年8月26日

Harmonyze 希望构建人工智能代理，以帮助特许人理解非结构化数据

对于某些企业来说，如果无需收购其他公司或有机扩张，那么有一条明确的增长路径：特许经营。根据 Statista 的数据，美国有超过 800,000 家特许经营企业，而且预计这个数字会逐年增长。但是特许经营一项业务——将业务模式和品牌授权给 [… ]

Harmonyze wants to build AI agents to help franchisors make sense of unstructured data techcrunch.com

RSS Hunter • 2024年8月26日

推进系统可靠性：Meta 的 AI 驱动的根本原因分析方法

Meta 最近分享了如何利用包括 AI 辅助 Hawkeye 在内的先进调查工具，来增强其系统可靠性。通过集成人工智能，Meta 开发了一种新的调查系统，该系统结合了基于启发式的检索和大语言模型 (LLM) 排名，以协助进行根本原因分析。

Advancing System Reliability: Meta's AI-Driven Approach to Root Cause Analysis infoq.com

RSS Hunter • 2024年8月26日

Opkey 是一家基于 AI 的 ERP 测试平台，融资 4700 万美元

由于强劲的客户吸引力——超过 200 个大型企业客户——该初创公司已完成 4,700 万美元的 B 轮融资。

Opkey, an AI-based ERP testing platform, raises $47M techcrunch.com

RSS Hunter • 2024年8月26日

LLM 驱动的 DevOps 助手 Clio 启动，帮助工程师管理云基础设施

Acorn 是一家帮助组织实施基于人工智能的技术解决方案的公司，最近推出了 Clio，这是一个由人工智能驱动的命令行助手，旨在帮助工程师管理 DevOps 工作流。Acorn 在一篇博文和 YouTube 直播中将 Clio 描述为一个“有点暴躁但友好的助手”，它可以通过自然语言来处理各种与 DevOps 相关的任务。

LLM-Powered DevOps Assistant Clio Launches to Help Engineers Manage Cloud Infrastructure infoq.com

RSS Hunter • 2024年8月26日

在 Codest 上引入新功能：生成 Flutter 和 React Native 应用！

在我们最近的新闻通讯中，我们介绍了 Codest，这是一个从图像生成 NextJS 应用的 AI 工具。基于它的成功，我们的 R&D 团队已经扩展了 Codest 的功能，现在还包括从图像生成 Flutter 和 React Native 应用的能力。我们在两个之前的博客文章中记录了我们的进度，并且很高兴地宣布，这些新功能现在已经在我们的概念证明（PoC）中可用。什么是新功能？ - Flutter 应用生成：Codest 现在可以从图像生成高质量、模块化的 Flutter 代码，具有明确的布局和数据分离。 - React Native 应用生成：类似于 Flutter 集成，Codest 也生成结构化、可重用的 React Native 代码。为什么使用 Codest？ Codest 已经证明可以减少开发时间高达 20%，为开发者提供干净、模块化的代码，从而简化移动和 Web 应用的开发过程。我们邀请您查看三个简短的视频，这些视频展示了 Codest 的实际操作，演示了它如何从图像生成 React Native、Flutter 和 Next.js 的功能应用。

Introducing New Features on Codest: Generate Flutter and React Native Apps! dev.to

RSS Hunter • 2024年8月26日

梦机器1.5让Sora和其他竞争对手AI视频制作软件措手不及

Luma Labs通过发布Dream Machine 1.5对它的Dream Machine AI视频生成器进行了显著的升级，提升了逼真度和对用户提示的响应性。这次更新给竞争对手带来了挑战，尤其是OpenAI，该公司的Sora AI视频模型还没有公开发布。Dream Machine 1.5提供了更快的视频生成速度，大约两分钟生成五秒的高质量视频，展示了改进后的逼真度、更流畅的动作和更好的文本渲染效果。这些进步使它成为在紧迫时间内工作的创作者和营销人员的宝贵工具。尽管面临着Runway、Stability AI和字节跳动的Jimeng等其他AI视频生成器的竞争，但Dream Machine 1.5因其可用性和性能而脱颖而出。这次发布标志着人工智能生成视频领域的一项重大发展，有可能通过实现快速、轻松地创作高质量视觉内容来改变娱乐、广告和新闻等行业。

Dream Machine 1.5 Catches Sora and other rival AI video makers napping techradar.com

RSS Hunter • 2024年8月26日

微软有争议的 AI 驱动的召回系统终于有了 ETA

经过数周的延迟，微软已公开表示 Recall for Copilot Plus PC 将于 10 月份开始公开测试。这款有争议的截屏挖掘系统在其首次发布时遇到了严峻的安全和隐私问题。AI 与争议并存，且最具争议的事件发生在今年年初，当时微软透露了推出 Recall for Copilot Plus PC 的计划。该系统在你使用 PC 时会持续截屏，并通过 AI 处理这些图片，然后允许你搜索图片以供稍后参考。经过数月的等待，我们终于得知微软准备向首批公开测试者开放 Recall 的时间。Recall 立即引起了隐私倡导者的担忧，他们担心仅仅记录你在 PC 上的全部行为就是一种不必要的隐私泄露——想象一下，如果有人能够获取这些记录，你的隐私将会暴露到何种程度。事实上，一位独立研究员进行的早期分析只会让人们更加担忧微软如何计划实施 Recall。

Microsoft’s contentious AI-powered Recall system finally has an ETA androidauthority.com

RSS Hunter • 2024年8月26日

McAfee 的 Deepfake 检测器为联想 AI 电脑保驾护航

Deepfake 视频使用人工智能模仿真实人物，构成了严重的网络安全风险，尤其会使用名人和公众人物的虚假内容欺骗人们。为了应对这种情况，McAfee 与联想合作推出了 Deepfake Detector，该工具旨在识别和标记精选联想人工智能电脑上的 deepfake 视频。该工具已接受过对 200,000 个视频样本的训练，可在带有神经处理单元 (NPU) 设备的本地运行，确保隐私和实时检测，而不需要云访问。该检测器最初在美国、英国和澳大利亚推出，包含在新的联想人工智能电脑中，提供 30 天试用期，之后是每年 10 美元的订阅费用。McAfee 和联想之间的合作旨在加强数字安全，但关于英特尔芯片的排他性仍不清楚。此外，McAfee 在 McAfee.ai 提供了智能人工智能中心，供用户分析视频中的 deepfake 并了解人工智能驱动的骗局。

McAfee’s Deepfake Detector keeps it real for Lenovo AI PCs techradar.com

RSS Hunter • 2024年8月26日

电信公司因涉嫌帮助拜登进行深度造假诈骗而向 FCC 支付 100 万美元

今年早些时候，AI驱动的假音频，声称是拜登总统，到了新罕布什尔州的选民。 FCC 迅速采取行动，确定了肇事者为德克萨斯州的 Life Corporation，该公司多年来一直在幕后策划类似的骗局，并对他们和一个相关个人处以600万美元的罚款。然而，这些骗子还雇佣了帮助者[…]。

Telecom that enabled Biden deepfake scam will pay FCC $1M techcrunch.com

RSS Hunter • 2024年8月26日

Adobe 停止使用“魔法修复”：图片编辑领域人工智能取得重大突破

Adobe发布了Magic Fixup，这是一种由人工智能驱动的照片编辑工具，它从视频数据中学习，承诺改变各个行业的创意工作流程，并实现高级图像处理的民主化。

Adobe drops ‘Magic Fixup’: An AI breakthrough in the world of photo editing venturebeat.com

RSS Hunter • 2024年8月26日

Gmail 的 ‘帮助我写邮件’ 功能现在可以使用人工智能改善你的电子邮件

Google 正在通过“帮助我撰写”快捷方式下的由 Gemini 提供支持的功能，扩展其在 Gmail 中的人工智能辅助写作。最新加入的是一个“润色”选项，可以优化电子邮件草稿，通常让它们更加正式，该选项可在移动和网络平台上使用。此外，在 iOS 和 Android 上撰写至少包含 12 个单词的电子邮件时，用户可以通过轻扫“完善我的草稿”提示来访问“润色”、“格式化”、“扩展”、“缩短”和“撰写新草稿”等选项。这些功能仅供 Google One 的 AI Premium 计划订阅者或拥有教育和商业特定 Gemini 插件的组织使用。然而，对于这些工具的实用性和效率存在怀疑，有些人质疑它们是否真正节省时间或提高电子邮件交流的质量。

Gmail’s ‘Help Me Write’ Feature Can Now Polish Up Your Emails With AI lifehacker.com

RSS Hunter • 2024年8月26日

实际操作 Ideogram 2.0：让文本看起来不可思议的人工智能

表意文字 2.0 通过更好的文本显示、颜色选项和更低的价格来改进人工智能图像创作，挑战大名并改变数字内容的制作方式。

Hands-on with Ideogram 2.0: The AI that makes text look incredible venturebeat.com

RSS Hunter • 2024年8月26日

D-ID 推出一款 AI 视频翻译工具，包括语音克隆和唇形同步

人工智能视频创作平台 D-ID 是最新一家利用人工智能技术为视频提供翻译功能的公司。然而，在这种情况下，D-ID 还克隆说话者的声音，并且改变他们的嘴唇动作以匹配翻译的单词，作为人工智能编辑过程的一部分。这项技术源自 D-ID 早期的 […]

D-ID launches an AI video translation tool that includes voice cloning and lip sync techcrunch.com

RSS Hunter • 2024年8月26日

Midjourney 向所有用户开放网站，提供 25 张免费 AI 图片生成

中译中之旅面临来自诸如 Elon Musk 的 xAI 和它的 Grok 2 和 Ideogram 2 等的日益激烈的竞争。

Midjourney opens website to all users, offering 25 free AI image generations venturebeat.com

RSS Hunter • 2024年8月26日

Anthropic 的 Claude 超过了 100 万美元的移动应用程序收入

然而，Claude 仍然远远落后于顶级竞争对手 ChatGPT。

Anthropic’s Claude surpasses $1M in mobile app revenue techcrunch.com

RSS Hunter • 2024年8月26日

7个AI PPT 制作者，为您下一个办公演示

你可能在大学的最后一年，努力让你的毕业设计项目脱颖而出，或者是一个职业人士，avigating日常会议和客户展示的需求。在这两种情况下，你都明白了一个强烈的第一印象在专业设置或个人遭遇中的重要性。一个设计良好的[…]

7 AI PPT Makers For Your Next Office Presentation analyticsvidhya.com

RSS Hunter • 2024年8月25日

在 Cloud Run 上使用 NVIDIA GPUs 运行您的 AI 推断应用程序

Google Cloud 已经推出了 NVIDIA L4 GPU 对 Cloud Run 的支持，现在处于预览阶段，使开发者能够轻松地进行实时 AI 推断。这个升级对使用开放式生成性 AI 模型的应用程序特别有益，如 Google 的 Gemma 和 Meta 的 Llama。主要特点包括快速自动缩放、缩放到零和按使用付费定价，使 Cloud Run 成为处理可变用户流量和成本优化的理想选择。借助这个新功能，开发者可以部署轻量级模型来执行任务，如自定义聊天机器人和文档摘要，也可以部署计算密集型应用程序，如图像识别和 3D 渲染。NVIDIA GPUs 通过加速 AI 推断过程来提高性能，提供低延迟和高效缩放，而 Cloud Run 的基础设施管理着底层复杂性。早期采用者，如 L’Oreal 和 Chaptr，对 GPU 集成的低启动时间、可扩展性和易用性表示赞赏。GPU 支持目前在 US-central1 区域可用，计划在年底扩展到欧洲和亚洲。要在 Cloud Run 上部署带 NVIDIA GPUs 的服务，开发者可以通过命令行或 Google Cloud 控制台指定 GPU 要求。此外，Cloud Run 现在还支持带 GPU 附加的函数，简化了基于事件的 AI 推断任务。

Run your AI inference applications on Cloud Run with NVIDIA GPUs cloud.google.com

RSS Hunter • 2024年8月25日

Openmart想让企业更容易地向当地企业销售。

2020年，Kathryn Wu在Pinterest担任产品工程师时启动了一个副业。吴启动了一家奶茶公司，OhTea，希望与当地杂货店和礼品店联系，让他们销售茶叶。吴很快意识到，不仅仅是与这些店铺建立联系很困难，还有很多其他挑战。

Openmart wants to make it easier for enterprises to sell to local businesses techcrunch.com

RSS Hunter • 2024年8月25日

LambdaTest推出KaneAI代理用于端到端软件测试

LambdaTest 表示，KaneAI 通过在一个平台上使用户能够管理整个测试旅程，而与众多其他 AI 编码代理不同。

LambdaTest launches KaneAI agent for end-to-end software testing venturebeat.com

RSS Hunter • 2024年8月25日

Skyfire推出，让自治人工智能代理在您名下花钱

Skyfire声称，它正在提供世界上第一个支持AI代理和LLM之间完全自治交易的支付网络。

Skyfire launches to let autonomous AI agents spend money on your behalf venturebeat.com

RSS Hunter • 2024年8月25日