简体中文版人工智能和 ML 新闻 笔记

简体中文版人工智能和 ML 新闻

“AI & ML 新闻 "是以人工智能和机器学习为重点的技术说明集。它收集了人工智能和 ML 最新发展的时事新闻和评论。 该新闻源涵盖了广泛的主题,包括新算法、应用和研究。它强调了行业趋势以及人工智能和 ML 对各经济领域的影响。 资料涉及神经网络、深度学习和自然语言处理等领域。还研究了人工智能在医疗保健、金融和其他行业的应用实例。 这些出版物对专家--开发人员和数据分析师,以及对人工智能技术发展感兴趣的任何人都有意义。人工智能伦理和数据隐私问题也在讨论之列。 新闻联播向读者介绍了人工智能市场的主要参与者--从大型公司到前途无量的初创企业。还介绍了有关人工智能系统开发工具和平台的信息。 “AI & ML News "旨在提供有关人工智能和机器学习发展的客观和最新信息。

笔记线程

想要进入机器学习的世界却觉得数学和统计学让自己无所适从?别担心,你并不是孤身一人!很多有抱负的数据科学家发现这些课题望而生畏。好消息是,网上有很多免费课程,可以帮助你建立坚实的基础。Coursera:斯坦福大学机器学习课程:这门传奇的课程不仅可以帮你了解机器学习的概念,还可以提供强有力的数学基础。 伦敦帝国理工学院机器学习数学:如果你希望深入了解数学概念,这门课程是一个很好的选择。edX:微软机器学习入门:这门课程提供了一种平衡的方法,它将机器学习的基础知识与必要的数学知识相结合。 哥伦比亚大学数据科学基础:这门课程以一种更广泛的视角来阐述数据科学,包括统计学和机器学习。 麻省理工学院开放课程:算法导论:虽然这门课程并不是专门讲授机器学习的,但它为算法和数据结构奠定了坚实的基础,这对于理解机器学习的概念至关重要。 概率和随机变量:深入理解概率论对于了解很多机器学习算法来说至关重要。可汗学院:线性代数:学习线性代数的综合资源,这是机器学习中的一个基本课题。 微积分:另一个至关重要的数学概念,微积分在可汗学院中有详细介绍。 统计学和概率论:扎实地理解统计学和概率论对于数据分析和机器学习至关重要。请记住:虽然这些课程提供了有价值的资源,但坚持不懈的练习和动手操作经验才是掌握这些课题的关键。从基础开始,随着信心的增强,逐渐增加复杂度。只要持之以恒并掌握正确的资源,你很快就能成为一名熟练的机器学习从业人员。学习愉快!
2024 年,欧洲人工智能行业在风险投资中表现出显著的韧性,截至 8 月,有 14 项投资超过 1 亿美元。这与初创企业普遍面临的融资困境形成了鲜明对比。值得注意的是,人工智能已成为一个强劲的投资领域,这由开发人工智能技术的高昂成本和人才激烈竞争所推动。欧洲今年人工智能领域最值得关注的交易包括:- Wayve:这家总部位于剑桥的初创公司筹集了 10.5 亿美元,用于提升其自动驾驶技术,标志着欧洲人工智能公司单笔融资额度的最高纪录。Wayve 专注于向汽车制造商出售其人工智能技术,而不是自己生产汽车。 - Mistral:Mistral 是大型语言模型构建领域中的杰出者,已通过两笔重要的融资(4.31 亿美元和 6.5 亿美元)筹集了超过 10 亿美元的资金。该公司强调开源技术,吸引着企业和开发者。 - Helsing:这家德国初创公司专注于国防应用方面的人工智能,已获得 4.84 亿美元的融资。其技术旨在增强防御系统和能力,尤其是在欧洲地缘政治紧张的背景下。 - Poolside:Poolside 面向软件开发者,筹集了 4 亿美元,用于开发人工智能工具以简化软件开发流程。 - DeepL:以人工智能驱动的翻译服务而闻名的 DeepL 筹集了 3.2 亿美元,专注于拥有约 100,000 家企业客户的 B2B 市场。 - H:这家初创公司的前身是 Holistic AI,以种子轮融资筹集了 2.2 亿美元,旨在开发用于任务自动化和决策的 AI 代理。 - Flo Health:这款总部位于伦敦的女性健康应用程序筹集了 2 亿美元,成为第一款估值超过 10 亿美元的纯数字健康应用程序。 - Pigment:这家巴黎初创公司提供企业资源规划解决方案,筹集了 1.45 亿美元,将其产品与人工智能相集成。总体而言,欧洲的人工智能格局的特点是大规模融资和对基础技术的关注,像巴黎这样的城市正成为人工智能开发的重要中心。
CdXz5zHNQW_1dHclHl6ue.jpeg
概述 作为 Substack 的机器学习工程师,你将在开发和实施尖端机器学习解决方案以增强我们的产品服务中发挥至关重要的作用。你将加入一个充满活力的团队,与软件工程师和数据科学家紧密合作,将机器学习模型引入我们的代码库,并将它们无缝集成到我们的产品中。该职位提供了一个塑造我们技术堆栈的未来并产生重大影响的绝佳机会。Substack 的薪酬待遇包括具有市场竞争力的薪酬、所有全职职位的股权,以及非凡的福利。该职位的现金报酬薪酬范围为 185,000 美元 - 240,000 美元。最终的要约金额由多个因素决定,包括候选人的经验和专业知识,可能与上述金额不同。职责 - 领导 Substack 关于 ML 采用以及 ML 工具和技术的集成的思考 - 与跨职能团队合作,识别和定义与我们的产品路线图一致的机器学习机会 - 使用 Python 和流行的 ML 框架开发、训练和部署机器学习模型 - 充分利用现成的 ML 工具和系统,以加速 Substack 将 ML 功能纳入其产品和工作流程的能力 - 将机器学习模型和管道集成到我们的主 JavaScript / TypeScript 应用程序中 - 针对性能、可扩展性和效率优化和微调 ML 模型 - 设计和实施用于数据预处理、特征工程和模型训练的数据管道 - 部署和拥有集成的产品体验和内部工具要求 - 在数据和机器学习系统方面拥有 7 年以上的相关经验 - 精通 Python 编程,并具备在机器学习中常用的 Python 库的经验(例如 Transformers 和 Tensorflow) - 扎实的机器学习算法、深度学习和统计建模基础 - 独立自主。我们的公司规模较小,无暇进行微观管理,我们希望公司中的每个人都能负责自己的工作,并且能够成为领导者。 - 在处理生产系统时,对自己和他人要求严格。 - 在与利益相关者的多元化群体合作的同时,还能为团队带来你独特的经验和背景额外要求 - 精通 Node.js 和 JavaScript,以便将机器学习模型无缝集成到我们的代码库中 - 熟悉云平台(例如 AWS 或 Modal) - 具备大规模处理消费者网络应用程序的经验Substack 是机会均等的雇主。我们将考虑所有求职者的就业资格,不分种族、肤色、宗教、性别(包括怀孕、性取向、性别认同或跨性别状态)、年龄、国籍、退伍军人或残疾状况。我们正在寻找热爱支持独立表达和为创作者构建更好商业模式的人。如果你希望了解媒体、社区和内容在摆脱广告模式后可以变成什么样,并且具备相关的技能和经验,我们很乐意与你见面。
谷歌人工智能研究部门 DeepMind 的近 200 名员工签署了一封信,敦促该公司终止与军事组织的合同。  《时代》杂志披露的 5 月 16 日信件强调了组织内部对该公司的 AI 技术被用于数字战争的道德影响的日益担忧。 签名者代表了 DeepMind 约 5% 的员工,批评该公司与包括以色列军方在内的各个政府签订合同,根据“Nimbus 计划”向其提供 AI 和云计算服务。谷歌员工担心他们的 AI 被用于战争。员工认为,这种参与违反了谷歌自己的 AI 原则,该原则规定公司不会追求会导致“总体危害”或有助于武器和监视的 AI 应用。 虽然这封信没有提到任何具体的地缘政治冲突,但它链接到声称以色列军事行动正在使用 AI 进行监视和瞄准的报告。 尽管 DeepMind 一直坚持不将自己的技术用于军事目的,但自 2014 年被收购以来,该业务已与 Google 的更广泛业务变得越来越密切,导致与军事合同联系更紧密。 尽管信中提出了要求,包括审查 DeepMind 的技术被军事客户使用的过程和成立一个新的管理机构,但谷歌尚未采取任何决定性行动。TechRadar Pro 已要求该公司对员工的内部信函发表评论,但我们并未立即收到答复。  该信的签署者之一向《时代》杂志表达了他们对谷歌对该投诉的答复的不满,称该公司对“Nimbus 计划”的声明“非常不具体,我们都不知道这实际上意味着什么”。
CdXz5zHNQW_dufSnWtrrX.jpeg
AI21 Labs 推出了 Jamba 1.5 模型系列,现已在 Google Cloud 的 Vertex AI Model Garden 公测。该系列包括两个模型:专为客户支持和文本生成等高效轻量级任务设计的 Jamba 1.5 Mini,以及擅长金融分析等高级推理任务的 Jamba 1.5 Large。这两个模型都具有 256K 上下文窗口,并使用 Mamba-Transformer 架构,提供了高效的处理和高级开发人员功能,例如函数调用、检索增强生成 (RAG) 优化和结构化 JSON 输出。这些模型是为企业应用程序量身定制的,尤其是在客户服务、金融分析和内容创建等领域。例如,它们可以总结冗长的文档、从财务数据中提取见解并生成高质量的内容。Jamba 1.5 模型是 Google Cloud 致力于开放和灵活的 AI 生态系统的更广泛承诺的一部分,它使用户能够构建最能满足他们需求的解决方案。这些模型在 Vertex AI 上可用,扩展了该平台的产品,其中包括 150 多个模型,使用户能够为自己的项目选择最佳工具。Vertex AI 支持对这些模型进行简单的试验、自定义和部署,从而可以实现优化性能、成本管理和安全部署。开发人员可以通过简单的 API 调用访问这些模型,并使用 Google Cloud 的托管基础架构(提供强大的安全性和合规性功能)部署这些模型。开始使用 Jamba 1.5 模型非常简单,用户可以直接从 Vertex AI Model Garden 或 Google Cloud Marketplace 中选择并启用模型。Google Cloud 继续与 AI21 Labs 等合作伙伴合作,提供尖端的 AI 功能,确保开发人员能够使用 AI 技术的最新进展。
CdXz5zHNQW_kfrguXguxE.jpeg
这篇文章探讨了生成式人工智能(GenAI)在自动化复杂办公任务,尤其是文档信息提取方面的演变和影响。作者回顾了自己作为领英机器学习工程师的经历,当时跨语言和地区准确解释职位名称是一项极具挑战性的任务。随着 GPT-4 等大型语言模型 (LLM) 的出现,曾经很困难的任务,例如理解和标准化简历,现在变得轻而易举。生成式人工智能的真正潜力在于自动化涉及从文档中提取见解的办公工作,这类工作占全球 GDP 的很大一部分。例子包括费用管理、医疗保健索赔判定和贷款承销。尽管众所周知,大型语言模型在某些情况下会出现“幻觉”,但在基于特定输入文档进行文本推理方面,它们表现出色。使用大型语言模型成功进行文档信息提取的关键是干净的文本转换和强大的模式设计,这确保了输出的一致性和准确性。作者强调了正确文本提取的重要性,其中涉及处理复杂的格式和注释。他们分享了自己构建 Docupanda.io 的经验,Docupanda.io 是一个 SaaS 解决方案,旨在通过生成干净的文本表示并遵循预定义的模式来解决文档理解方面的挑战。文章强调,定义这些模式至关重要,人工智能可以通过迭代反馈帮助完善它们。最后,作者鼓励探索使用大型语言模型来规范文档处理,并表示生成式人工智能真正的“杀手级应用”是其转变基于文档的办公工作的能力。
CdXz5zHNQW_gZEuCrmBfg.jpeg