Meta brengt LLaMA-AI-taalmodellen uit voor wetenschappelijk onderzoek

Meta heeft een verzameling AI-taalmodellen uitgebracht die onderzoekers moeten helpen taalmodellen te onderzoeken. De LLaMA-taalmodellen komen vooralsnog niet publiekelijk beschikbaar. Meta werkt al jaren aan AI-taalmodellen, net als bijvoorbeeld Google en OpenAI.

Large Language Model Meta AI, of LLaMA, bestaat uit vier AI-taalmodellen uit verschillende groottes, die alle vier relatief klein zijn. Daardoor vereisen ze volgens Meta minder rekenkracht dan andere AI-taalmodellen, wat ze beter geschikt maakt voor onderzoeksdoeleinden.

“Het afgelopen jaar hebben taalmodellen nieuwe mogelijkheden laten zien voor het maken van creatieve teksten, het oplossen van wiskundige stellingen, het voorspellen van eiwitstructuren en het beantwoorden van begrijpend-lezenvragen”, schrijft Meta. Hiermee doelt het bedrijf onder meer op de chatbots van bijvoorbeeld Google en Microsoft. Het Facebook-moederbedrijf zegt dat het echter lastig is om wetenschappelijk onderzoek te doen met deze modellen, omdat ze zodanig groot zijn dat er veel rekenkracht nodig is om te begrijpen hoe en waarom ze werken.

Meta zegt dat door deze belemmering, het lastiger is om de robuustheid te verbeteren en ‘bekende problemen als vooroordelen, toxicity en het potentieel verspreiden van desinformatie’ op te lossen. Het bedrijf hoopt dat met de kleinere taalmodellen hier beter onderzoek naar gedaan kan worden. De LLaMA-taalmodellen worden alleen na controle verstrekt aan onderzoekers die betrokken zijn bij overheidsinstellingen, maatschappelijke organisaties of wetenschappelijke instellingen. Afgelopen mei bracht Meta een ander taalmodel uit voor wetenschappelijk onderzoek.

Meta brengt LLaMA-AI-taalmodellen uit voor wetenschappelijk onderzoek

Recent Posts

Recent Comments