AI 및 ML 뉴스 노트

AI 및 ML 뉴스

'AI & ML 뉴스'는 인공지능과 머신러닝에 초점을 맞춘 기술 노트 모음입니다. AI와 머신러닝의 최신 개발 동향에 대한 최신 뉴스와 리뷰를 모았습니다. 이 피드에서는 새로운 알고리즘, 애플리케이션, 연구 등 다양한 주제를 다룹니다. 업계 동향과 AI와 ML이 경제의 다양한 부문에 미치는 영향을 강조합니다. 자료는 신경망, 딥러닝, 자연어 처리와 같은 분야를 다룹니다. 의료, 금융 및 기타 산업에서의 AI 적용 사례도 살펴봅니다. 이 자료는 개발자와 데이터 분석가 등 전문가뿐만 아니라 AI 기술 개발에 관심이 있는 모든 사람에게 흥미로울 것입니다. AI 윤리 및 데이터 프라이버시 문제도 다룹니다. 이 피드는 대기업부터 유망한 스타트업에 이르기까지 AI 시장의 주요 플레이어를 소개합니다. AI 시스템 개발을 위한 도구와 플랫폼에 대한 정보가 제공됩니다. 'AI & ML 뉴스'는 인공지능과 머신러닝의 발전에 관한 객관적이고 최신 정보를 제공하는 것을 목표로 합니다.

노트 스레드

이 블로그는 멀티모달 임베딩을 통해 이미지와 비디오를 검색 기능에 통합하여 텍스트를 넘어서는 검색 기술의 발전에 대해 논의합니다. 전통적인 엔터프라이즈 검색 엔진은 텍스트 기반 쿼리를 위해 설계되었으며, 이로 인해 시각적 콘텐츠를 처리하는 기능이 제한되었습니다. 자연어 처리(NLP) 및 멀티모달 임베딩을 통합하면 이제 크로스 모달 의미 검색을 수행할 수 있게 되어 사용자가 텍스트와 동일한 방식으로 이미지와 비디오를 검색할 수 있습니다. 이 블로그에서는 미디어 저장에 Google Cloud Storage를 사용하고 색인 생성에 BigQuery를 사용하여 텍스트-이미지, 텍스트-비디오, 결합 검색을 수행할 수 있는 시스템을 보여줍니다. 멀티모달 임베딩 모델이 미디어 파일에 대한 임베딩을 생성하여 효율적인 유사성 검색을 가능하게 합니다. 이 아키텍처는 원활한 크로스 모달 검색 경험을 지원하여 콘텐츠 검색을 더욱 직관적으로 만듭니다. 사용자의 텍스트 입력은 임베딩으로 변환되고 저장된 미디어 데이터와 쿼리를 일치시키기 위해 벡터 검색이 수행됩니다. 마지막으로, 가장 관련성이 높은 이미지 또는 비디오 URI와 유사성 점수가 사용자에게 표시됩니다. 이 방법은 검색 경험을 개선하여 시각적 콘텐츠를 검색할 수 있는 새로운 가능성을 열어줍니다.
CdXz5zHNQW_1XAuQPcNYE.jpeg
CdXz5zHNQW_x8MllfWBsD.jpeg
기계 학습의 세계에 뛰어들고 싶지만 수학과 통계에 압도되는 느낌이 드시나요? 걱정 마세요, 당신만 그런 것이 아닙니다! 많은 열망 있는 데이터 과학자들이 이러한 주제를 힘들게 여깁니다. 좋은 소식은, 탄탄한 기반을 쌓는 데 도움이 되는 수많은 무료 온라인 과정이 있다는 것입니다.Coursera:앤드류 응의 기계 학습: 이 전설적인 과정은 기계 학습 개념을 소개할 뿐만 아니라 강력한 수학적 기반도 제공합니다. 임페리얼 칼리지 런던의 기계 학습 수학: 수학적 개념에 대해 깊이 파고들고 싶다면 이 과정이 훌륭한 선택입니다.edX:마이크로소프트의 기계 학습 소개: 이 과정은 기계 학습 기본 사항과 필요한 수학적 지식을 결합한 균형 잡힌 접근 방식을 제공합니다. 컬럼비아 대학의 데이터 과학 기초: 통계와 기계 학습을 포함한 데이터 과학에 대한 더 넓은 관점이 이 과정에서 제공됩니다. MIT OpenCourseWare:알고리즘 소개: 기계 학습에 대한 것이 아니지만 이 과정은 기계 학습 개념을 이해하는 데 필수적인 알고리즘과 데이터 구조에 대한 탄탄한 기반을 마련합니다. 확률과 확률 변수: 확률 이론에 대한 심층적인 연구는 많은 기계 학습 알고리즘을 이해하는 데 필수적입니다.칸 아카데미:선형 대수: 기계 학습의 기본 주제인 선형 대수를 배우는 데 유용한 리소스입니다.미적분: 또 다른 필수적인 수학적 개념인 미적분은 칸 아카데미에서 자세히 다룹니다.통계와 확률: 통계와 확률에 대한 탄탄한 이해는 데이터 분석과 기계 학습에 필수적입니다.이러한 과정이 가치 있는 리소스를 제공하지만 이러한 주제를 마스터하는 데는 지속적인 연습과 실습 경험이 핵심임을 기억하세요. 기본 사항부터 시작해서 자신감이 생기면 점차 복잡성을 높이세요. 헌신과 적절한 리소스를 바탕으로 숙련된 기계 학습 실무자가 되는 길로 나아가게 될 것입니다.즐거운 학습이 되시길 바랍니다!
2024년 유럽 AI 산업은 8월 기준 1억 달러를 초과한 투자 14건으로 벤처캐피털 투자에서 놀라운 탄력성을 보였습니다. 스타트업을 위한 전체적인 난관, 즉 자금 조달이 어려운 환경과는 대조적입니다. 주목할 점은 AI가 투자의 강력한 분야로 부상했는데, AI 기술 개발과 인재 확보를 위한 치열한 경쟁으로 인한 높은 비용 때문입니다.올해 유럽에서 이루어진 주요 AI 거래에서 핵심 하이라이트는 다음과 같습니다. - 웨이브(Wayve): 캠브리지 소재의 이 스타트업은 자율주행 기술을 강화하는 데 10억 5천만 달러를 조성하여 유럽 AI 기업의 단일 펀딩 라운드 중에서 가장 규모가 컸습니다. 웨이브는 차량을 직접 생산하기보다는 자사의 AI 기술을 자동차 제조업체에 판매하는 데 중점을 두고 있습니다. - 미스트랄(Mistral): 대규모 언어 모델 구축 분야의 저명한 기업인 미스트랄은 두 차례에 걸친 중요한 펀딩 라운드에서 4억 3천 1백만 달러와 6억 5천만 달러를 조성하여 총 10억 달러 이상을 모았습니다. 이 회사는 오픈 소스 기술을 강조하며, 기업과 개발자에게 어필합니다. - 헬싱(Helsing): 방위 애플리케이션을 위한 AI에 중점을 둔 독일 스타트업인 헬싱은 4억 8천 4백만 달러를 확보했습니다. 이 회사의 기술은 특히 유럽의 지정학적 긴장 고조로 인해 방위 시스템과 역량을 강화하는 데 목적이 있습니다. - 풀사이드(Poolside): 소프트웨어 개발자를 타겟으로 하는 풀사이드는 소프트웨어 개발 프로세스를 간소화하는 AI 툴을 개발하는 데 4억 달러를 모았습니다. - 딥엘(DeepL): AI 기반 번역 서비스로 유명한 딥엘은 3억 2천만 달러를 조성하여 약 10만 개의 기업 고객을 보유한 B2B 시장에 중점을 두고 있습니다. - H: 이전 이름은 홀리스틱 AI로, 이 스타트업은 시드 라운드로 2억 2천만 달러를 조성하여 태스크 자동화 및 의사결정을 위한 AI 에이전트를 개발하는 데 목적이 있습니다. - 플로 헬스(Flo Health): 런던에 위치한 여성 건강 앱은 2억 달러를 조성하여 10억 달러 이상의 평가를 달성한 최초의 순수 디지털 건강 앱이 되었습니다. - 피그먼트(Pigment): 기업 자원 계획 솔루션을 제공하는 파리의 스타트업인 피그먼트는 1억 4천 5백만 달러를 조성하여 해당 서비스에 AI를 통합했습니다.전반적으로, 유럽 AI 환경은 상당한 펀딩 라운드와 기반 기술에 대한 중점이 특징이며, 파리와 같은 도시가 AI 개발의 주요 거점으로 부상하고 있습니다.
CdXz5zHNQW_1dHclHl6ue.jpeg
개요 서브스택의 ML 엔지니어는 최첨단 머신러닝 솔루션을 개발하고 구현하여 제품 제공을 향상하는 데 중요한 역할을 하게 됩니다. 여러분은 소프트웨어 엔지니어와 데이터 과학자와 긴밀히 협력하며 역동적인 팀에 합류하여 머신러닝 모델을 코드베이스에 도입하고 원활하게 제품에 통합합니다. 이 직책은 기술 스택의 미래를 형성하고 중요한 영향을 미칠 수 있는 흥미로운 기회를 제공합니다.서브스택의 보상 패키지에는 시장 경쟁력 급여, 모든 정규직 직원에 대한 지분, 뛰어난 혜택이 포함됩니다. 이 직책의 현금 보상 급여 범위는 $185,000~240,000입니다. 최종 제안 금액은 지원자의 경험과 전문성을 포함한 여러 요인에 따라 결정되며 위에 나열된 금액과 다를 수 있습니다.책임 - 서브스택의 ML 도입 및 ML 도구와 기술의 통합에 대한 사고를 주도합니다. - 교차 기능 팀과 협력하여 제품 로드맵과 일치하는 머신러닝 기회를 파악하고 정의합니다. - Python과 인기 ML 프레임워크를 사용하여 머신러닝 모델을 개발, 훈련, 배포합니다. - 기성 ML 도구와 시스템을 활용하여 서브스택이 제품 및 워크플로우에 ML 기능을 통합하는 능력을 가속화합니다. - 머신러닝 모델과 파이프라인을 주 JavaScript/TypeScript 앱에 통합합니다. - 성능, 확장성, 효율성을 위해 ML 모델을 최적화하고 조정합니다. - 데이터 전처리, 피처 엔지니어링, 모델 훈련을 위한 데이터 파이프라인을 설계하고 구현합니다. - 통합된 제품 경험과 내부 도구를 배포하고 소유합니다.요구 사항 - 데이터 및 ML 시스템에서 7년 이상의 관련 경험 - Python에서의 강력한 프로그래밍 기술 및 머신러닝에 일반적으로 사용되는 Python 라이브러리(예: 트랜스포머 및 텐서플로우)를 사용한 경험 - 머신러닝 알고리즘, 심층 학습, 통계적 모델링에 대한 탄탄한 이해 - 독립적이고 자율적입니다. 회사의 규모가 너무 작아서 일을 세세히 관리할 수 없으며, 회사의 모든 직원이 자신의 업무를 소유하고 리더가 될 수 있기를 기대합니다. - 프로덕션 시스템에서 작업할 때 자신과 타인에게 높은 기준을 유지합니다. - 다양한 이해 관계자와의 협력을 즐기면서 고유한 경험과 배경을 팀에 제공합니다.보유하면 좋음 - 코드베이스에 머신러닝 모델을 원활하게 통합하기 위한 Node.js와 JavaScript에 대한 능숙함 - 클라우드 플랫폼(예: AWS 또는 Modal)에 대한 지식 - 규모에 맞는 소비자 웹 애플리케이션 경험서브스택은 기회균등 고용주입니다. 모든 지원자는 인종, 피부색, 종교, 성별(임신, 성적 지향, 성 정체성 또는 트랜스젠더 상태 포함), 나이, 국적, 재향군인 또는 장애 상태에 관계없이 고용으로 고려됩니다. 독립적인 표현을 가능하게 하고 창작자를 위한 더 나은 비즈니스 모델을 구축하는 데 열정적인 사람을 찾습니다. 광고 모델에서 벗어날 때 미디어, 커뮤니티, 콘텐츠가 무엇이 될 수 있는지 확인하고 기여할 수 있는 기술과 경험이 있다면 여러분을 만나고 싶습니다.
CdXz5zHNQW_2T09iCSRkR.png
Google의 AI 연구 부문인 Google DeepMind의 직원 200여 명이 군 기관과의 계약을 중단하라고 회사에 촉구하는 서한에 서명했습니다.TIME에서 밝힌 5월 16일자 서한은 AI 기술이 디지털 전쟁에 사용되는 것에 대한 윤리적 의미에 대해 조직 내에서 우려가 커지고 있음을 강조합니다.서명자는 DeepMind 인력의 약 5%를 차지하며, Project Nimbus를 통해 이스라엘 군부 등 다양한 정부에 AI 및 클라우드 컴퓨팅 서비스를 제공하기 위한 회사의 계약을 지적합니다.Google 직원은 AI가 전쟁에 사용되는 것을 걱정합니다.직원들은 이러한 관여가 Google 자체의 AI 원칙을 위반한다고 주장하는데, 이 원칙에서는 회사가 "전반적인 피해"를 초래하거나 무기나 감시에 기여하는 AI 응용 프로그램을 추구하지 않을 것이라고 명시하고 있습니다.이 서한은 특정 지정학적 갈등에 대해 언급하지 않지만 이스라엘 군 작전이 AI를 사용하여 감시 및 표적 지정을 하는 것이라는 주장이 담긴 보고서와 연결되어 있습니다.DeepMind는 역사적으로 군사적 목적으로 기술을 사용하는 것을 금지하는 정책을 유지해 왔지만, 2014년 인수 이후 군 계약과의 유대 관계가 긴밀해지면서 Google의 광범위한 사업에 점점 더 가까워졌습니다.DeepMind의 기술이 군 고객에 의해 사용되고 새로운 거버넌스 기구를 설립하는 것에 대한 검토를 요구하는 서한의 요구 사항에도 불구하고, Google은 어떤 결정적인 조치도 취하지 않았습니다. TechRadar Pro는 직원으로부터 온 내부 서한에 대해 회사에 논평을 요청했지만 즉시 답변을 받지 못했습니다.서한 서명자 중 한 명은 TIME에 Google의 불만에 대한 대응에 불만을 표하며 Project Nimbus에 대한 회사의 성명은 "너무 특정하지 않아서 우리 모두는 그 실제 의미를 모른다"고 말했습니다.
CdXz5zHNQW_dufSnWtrrX.jpeg
CdXz5zHNQW_GEQ4HPEs5i.jpeg
CdXz5zHNQW_LL4HTs3TLM.jpeg
CdXz5zHNQW_dLgS4NZnT9.jpeg
CdXz5zHNQW_DBzXHXPWBL.png
AI21 Labs는 Google Cloud의 Vertex AI Model Garden에서 공개 프리뷰로 제공되는 Jamba 1.5 모델 패밀리를 출시했습니다. 이 패밀리에는 고객 지원 및 텍스트 생성과 같은 효율적이고 가벼운 작업을 위해 설계된 Jamba 1.5 Mini와 재무 분석과 같은 고급 추론 작업에 뛰어난 Jamba 1.5 Large 등 두 가지 모델이 포함됩니다. 두 모델 모두 256K 컨텍스트 윈도우를 사용하고 Mamba-Transformer 아키텍처를 사용하여 효율적인 프로세싱과 함수 호출, 검색 증강 생성(RAG) 최적화, 구조적 JSON 출력과 같은 고급 개발자 기능을 제공합니다.이러한 모델은 고객 서비스, 재무 분석, 콘텐츠 생성과 같은 분야를 중심으로 하는 엔터프라이즈 애플리케이션에 맞춤화되었습니다. 예를 들어, 긴 문서를 요약하고, 재무 데이터에서 통찰력을 추출하고, 고품질 콘텐츠를 생성할 수 있습니다. Jamba 1.5 모델은 엔터프라이즈 사용자가 요구 사항에 가장 적합한 솔루션을 구축할 수 있도록 하는 개방적이고 유연한 AI 에코시스템에 대한 Google Cloud의 더 광범위한 약속의 일부입니다.Vertex AI에서 사용 가능한 이러한 모델은 150개 이상의 모델을 포함하는 플랫폼의 제품을 확장하여 사용자가 프로젝트에 가장 적합한 도구를 선택할 수 있도록 합니다. Vertex AI는 이러한 모델의 간편한 실험, 사용자 지정 및 배포를 지원하여 최적화된 성능, 비용 관리 및 안전한 배포를 가능하게 합니다. 개발자는 간단한 API 호출을 통해 이러한 모델에 액세스하고 강력한 보안 및 규정 준수 기능을 제공하는 Google Cloud의 관리형 인프라를 사용하여 배포할 수 있습니다.Jamba 1.5 모델을 시작하는 것은 간단하며 사용자는 Vertex AI Model Garden이나 Google Cloud Marketplace에서 모델을 직접 선택하고 활성화할 수 있습니다. Google Cloud는 AI21 Labs와 같은 파트너와 협력하여 최첨단 AI 역량을 제공하고 개발자가 최신 AI 기술 진보에 액세스할 수 있도록 합니다.
CdXz5zHNQW_kfrguXguxE.jpeg
이 기사에서는 생성 AI(GenAI)가 복잡한 사무 작업, 특히 문서 추출을 자동화하는 데 미치는 영향과 진화에 대해 논의한다. 저자는 LinkedIn에서 기계 학습 엔지니어로 일하며 다양한 언어와 지역의 직책을 정확히 해석하는 것이 힘든 작업이었다는 경험을 되새긴다. GPT-4와 같은 대규모 언어 모델(LLM)의 등장으로, 이전에는 어려웠던 이력서를 이해하고 표준화하는 작업도 쉬워졌다. GenAI의 진정한 잠재력은 세계 GDP의 상당 부분을 차지하는 문서에서 통찰력을 추출하는 사무 작업을 자동화하는 데 있다. 여기에는 경비 관리, 의료 청구 심사, 대출 인수 등이 포함된다. LLM은 어떤 맥락에서는 환상을 갖는 것으로 알려져 있지만, 특정 입력 문서를 기반으로 추론할 때는 탁월하다. LLM을 사용한 문서 추출을 성공시키는 핵심은 일관되고 정확한 출력을 보장하는 깔끔한 텍스트 변환과 견고한 스키마 설계이다. 저자는 복잡한 서식과 주석을 처리하는 적절한 텍스트 추출의 중요성을 강조한다. 저자는 Docupanda.io라는 SaaS 솔루션을 구축한 경험을 공유한다. 이 솔루션은 깔끔한 텍스트 표현을 생성하고 사전 정의된 스키마를 따름으로써 문서 이해의 과제를 해결하도록 설계되었다. 이 기사에서는 이러한 스키마를 정의하는 것이 중요하며 AI가 반복적 피드백을 통해 스키마를 다듬는 데 도움이 될 수 있음을 강조한다. 마지막으로 저자는 문서 처리를 정규화하는 데 LLM을 사용해 보는 것을 권장하며 GenAI의 진정한 "킬러 앱"은 문서 기반 사무 작업을 혁신할 수 있는 능력이라고 제안한다.
CdXz5zHNQW_gZEuCrmBfg.jpeg
CdXz5zHNQW_m2AdynPdCB.jpeg
CdXz5zHNQW_pC0zeBYUXD.jpeg
Google Cloud는 현재 프리뷰 버전으로 제공되는 Cloud Run에 NVIDIA L4 GPU 지원을 도입하여 개발자가 실시간 AI 추론을 쉽게 수행할 수 있도록 지원합니다. 이 업그레이드는 Google의 Gemma 및 Meta의 Llama와 같은 개방형 생성 AI 모델을 활용하는 애플리케이션에 특히 유용합니다. 주요 기능으로는 빠른 자동 확장, 스케일 투 제로, 사용량 기반 요금제 등이 있으며, Cloud Run은 다양한 사용자 트래픽을 처리하고 비용을 최적화하는 데 이상적입니다.이 새로운 기능을 통해 개발자는 맞춤형 챗봇 및 문서 요약과 같은 작업이나 이미지 인식 및 3D 렌더링과 같은 컴퓨팅 집약적인 애플리케이션을 위한 경량 모델을 배포할 수 있습니다. NVIDIA GPU는 AI 추론 프로세스의 속도를 높여 성능을 향상시키고, 짧은 지연 시간과 효율적인 확장을 제공하며, Cloud Run의 인프라가 근본적인 복잡성을 관리합니다.로레알과 Chaptr과 같은 얼리어답터들은 GPU 통합의 짧은 시작 시간, 확장성, 사용 편의성에 대해 찬사를 보냈습니다. GPU 지원은 현재 미국 중부1 지역에서 제공되고 있으며, 연말까지 유럽과 아시아로 확대될 예정입니다.개발자는 명령줄 또는 Google Cloud 콘솔을 통해 GPU 요구 사항을 지정하여 Cloud Run에 NVIDIA GPU가 포함된 서비스를 배포할 수 있습니다. 또한, 이제 Cloud Run은 GPU가 첨부된 기능을 지원하여 이벤트 기반 AI 추론 작업을 간소화합니다.