Hermes 3: Ensimmäinen hienosäädetty Llama 3.1 405B -malli

Nous Research on käynnistänyt Hermes 3:n, ensimmäisen täyden parametrin hienosäädön Meta's Llama 3.1 405B -mallille, jota koulutettiin Lambda's 1-Click Cluster -alustalla. Hermes 3 on neutraali, yleisesti käyttökelpoinen malli, jolla on vahvat päättelykyvyt, suunniteltu avoimen lähdekoodin yhteisölle ja saatavilla ilmaiseksi Lambda's Chat Completions API:n kautta. Malli erottuu luovissa tehtävissä, kuten roolileikkeleissä ja fiktiivisessä tuotannossa, sekä ammatillisissa sovelluksissa, joissa vaaditaan edistynyttä päättelyä ja päätöksentekoa. Hermes 3 koulutettiin käyttäen syntetisoitua dataa, valvottua hienosäätöä ja vahvistavaa oppimista ihmisiltä saadusta palautteesta, seurattuna Neural Magicin FP8-quantisaatiolla, mikä vähensi mallin VRAM- ja levyvaatimuksia 50%. Se toimii tehokkaasti yhdellä solmulla tai skaalautuu usean solmun klusteriin edelleen hienosäätöä varten. Hermes 3 on lukittu, sensuroimaton ja ohjattavissa, tarjoten joustavuuden ja soveltuvuuden käyttäjien tarpeisiin. Malli suoriutuu paremmin Llama 3.1 Instruct -benchmarkissa ja on saatavilla ilmaiseksi Lambda's uuden Chat Completions API:n kautta, joka on yhteensopiva OpenAI API:n kanssa. API tarjoaa helpon pääsyvyyden ilman monimutkaista asennusta, sallien käyttäjien luoda täydennyksiä ja keskustelut täydennyksiä vaivattomasti.

lambdalabs.com

Hermes 3: The First Fine-Tuned Llama 3.1 405B Model

Hermes 3: Ensimmäinen hienosäädetty Llama 3.1 405B -malli

TheNote.app (macOS, iOS and Android apps)

2024-08-16

Create attached notes ...