Büyük dil modellerini (BDM) kullanarak geliştiriciler, iki temel sorunu karşılamaktadır: BDM çıkışlarının rastgeleliğini yönetme ve yanlış bilgiler üretebilme eğilimini azaltma. BDM'lerin rastgeleliği, yaratıcı içerik oluşturma için faydalı olsa da, tutarlılık ve gerçeklik gibi unsurların önemli olduğu durumlarda bir engel olabilir. Bu rastgelelik, özellikle BDM'lerin yanlış bilgilerle "halüsinasyonlar" üretebilme yeteneğini kullanarak, güvenilirliklerini azaltmaktadır. Pek çok görev, örneğin bilgiler özetleme veya pazarlama içeriği oluşturma, tek bir doğru cevaba sahip olmadığında, BDM'lerin rastgeleliği hem bir zorluk hem de bir fırsat olarak ortaya çıkmaktadır.
Örnek olarak, bir finans kurumunda, müşteri konuşmalarının özetlerinin doğru, özlü ve iyi yazılmış olması gerekmektedir. Bu sorunu, BDM'lerle birden fazla yanıt üretecek ve Vertex Gen AI Değerlendirme Hizmetini kullanarak en iyi yanıtı seçerek ele aldılar. Kontrollü rastgelelikle özetlerin birden fazla versiyonunu üretecek olan bu yöntem, optimal bir yanıt bulma olasılığını artırmaktadır. Bu yanıtlar, çiftli değerlendirmeyle karşılaştırılmaktadır, böylece en doğru ve ilgili olan yanıt belirlenebilmektedir.
Son olarak, en iyi yanıt, kaliteli standartları karşıladığını sağlamak için noktasal değerlendirmeyle değerlendirilmektedir, böylece şeffaflık için puanlar ve açıklamalar sağlanmaktadır. Bu iş akışı, farklı kullanım durumları ve modaliteleri için uyarlanabilir ve BDM'lerin varyasyonunu, en iyi çıktıyı sistematik olarak değerlendirerek ve seçerek, BDM tarafından üretilen içeriklerin kalitesini, güvenilirliğini ve güvenilirliğini artırmaktadır.
cloud.google.com
Enhancing LLM quality and interpretability with the Vertex Gen AI Evaluation Service
Create attached notes ...