Az OpenAI célja, hogy az érvelő AI-modellek fejlesztése során olyan keretrendszert hozzon létre, amely megakadályozza a bűnözői tevékenységek támogatását.


A technológia rohamtempóban zajló fejlődése következtében a biztonsági intézkedések szerepe is egyre jelentősebbé válik.

Az OpenAI, a ChatGPT mögött álló innovatív vállalat, múlt pénteken leleplezte legújabb nyelvi modelljét, az o3-at. Az új modell ígérete szerint jelentősen túlszárnyalja az o1-et és a korábbi verziókat. A cég szakértői úgy vélik, hogy ez a fejlődés egy új, átfogó biztonsági paradigmának köszönhető, amelyet kifejezetten az o-sorozatú modellek tréningjéhez terveztek.

Az ezek mögött álló technológia lényegében biztosítja, hogy a vállalat érvelő AI-modelljei összhangban maradjanak a fejlesztők által meghatározott értékekkel és irányelvekkel. Az OpenAI a módszert annak elérésére használta, hogy az o1 és o3 modellek a felhasználói parancsok feldolgozása során is "gondolkodjanak" a biztonsági kérdésekről, ezzel minimalizálva a nem kívánatos válaszokat.

A vállalat kutatásai rámutattak, hogy a módszer jelentős előrelépést hozott az o1 és o3 megfelelőségében a vállalat biztonsági irányelveivel. E gyakorlat következményeként a modellek ritkábban reagáltak olyan kérdésekre, amelyeket az OpenAI nem tekintett biztonságosnak, ugyanakkor a "jóindulatú" kérdések kezelésében hatékonyabbá váltak.

Az o-sorozatú modellek a kérdések megválaszolásakor belsőleg "mérlegelik", hogy miként nyújthatják a legbiztonságosabb válaszokat. Ez a mechanizmus meglehetősen hasonló ahhoz a módszerhez, amit más modellek alkalmaznak, amikor bonyolult utasításokat kisebb, könnyebben kezelhető részekre osztanak, mielőtt végső válaszukkal előállnának.

A mesterséges intelligencia biztonsága komplex kérdéskör, amely számos aspektust ölel fel. Az OpenAI különösen arra fókuszál, hogy megakadályozza a modellek válaszainak visszaélését veszélyes célokra. Ilyenek lehetnek például a bombakészítési útmutatók, kábítószer-beszerzési tippek, vagy bűncselekmények elkövetésére vonatkozó információk kérése a chatbotoktól. Az OpenAI egyik alapvető célja, hogy az ilyen típusú kérésekre a modellek ne adjanak választ, ezzel biztosítva a technológia felelősségteljes használatát.

Related posts