Blog, metin dışındaki arama teknolojilerindeki gelişmeleri ele alıyor ve çoklu katmanlı eklemeler aracılığıyla arama özelliklerine resim ve videoları dahil ediyor. Geleneksel kurumsal arama motorları metin tabanlı sorgular için tasarlanmıştı ve bu da görsel içerikleri yönetme becerilerini sınırlandırdı. Doğal dil işleme (NLP) ve çoklu katmanlı eklemeleri entegre ederek artık, kullanıcıların metinle yaptıkları gibi resim ve videoları da aramasına olanak tanıyan çoklu-modal anlamsal aramalar gerçekleştirmek mümkün. Blog, medya depolama için Google Cloud Storage ve indeksleme için BigQuery kullanarak metinden resme, metinden videoya ve birleştirilmiş aramalar gerçekleştirebilen bir sistem göstermektedir. Medya dosyaları için çoklu katmanlı ekleme modeli kullanılır ve bu da verimli benzerlik aramalarına olanak tanır. Mimari, kesintisiz çoklu-modal arama deneyimlerini destekleyerek içerik keşfini daha sezgisel hale getirir. Kullanıcının metin girdisi bir eklemeye dönüştürülür ve sorguyu depolanan medya verileriyle eşleştirmek için bir vektör araması gerçekleştirilir. Son olarak sonuçlar, en ilgili resim veya video URI'leri ve benzerlik puanlarıyla kullanıcıya sunulur. Bu yaklaşım, arama deneyimini geliştirir ve görsel içerik arama için yeni olasılıkların kilidini açar.
cloud.google.com
A multimodal search solution using NLP, BigQuery and embeddings
Create attached notes ...