🥳 OpenAI жаңа әрі аса қуатты нейрожелі — o3-ті таныстырды!
Масштабты түсіну үшін бірнеше маңызды деректер:
✔️ o3 жұмыс кодын o1-мен салыстырғанда 1,5 есе тиімдірек жазады;
✔️ Codeforces платформасында 2727 рейтингіне қол жеткізіп, OpenAI инженерімен салыстырғанда озық болды;
✔️ PhD деңгейіндегі математикалық есептерді оңай шешеді;
✔️ AIME 2024 (АҚШ-тағы ең ақылды 2,5% студенттерге арналған тест) бойынша рекордтық 25.2% ұпай жинады;
✔️ GPQA Diamond (198 ғылыми сұрақтан тұратын тест) нәтижесінде 87.7% көрсеткішке жетті, бұл адам-мамандардан да жоғары!
✔️ Бұрын бірде-бір нейрожелі орындай алмаған логикалық тапсырма бенчмаркін сәтті аяқтады.
🗓 Қазір модель қауіпсіздік тексерісінен өтуде. Қаңтардың соңында жеңілдетілген o3-mini нұсқасы шығады, ал кейін толық o3 нұсқасы жарық көреді.
😉 Бұлар таң қалдырудан жалықпайды екен...
Масштабты түсіну үшін бірнеше маңызды деректер:
✔️ o3 жұмыс кодын o1-мен салыстырғанда 1,5 есе тиімдірек жазады;
✔️ Codeforces платформасында 2727 рейтингіне қол жеткізіп, OpenAI инженерімен салыстырғанда озық болды;
✔️ PhD деңгейіндегі математикалық есептерді оңай шешеді;
✔️ AIME 2024 (АҚШ-тағы ең ақылды 2,5% студенттерге арналған тест) бойынша рекордтық 25.2% ұпай жинады;
✔️ GPQA Diamond (198 ғылыми сұрақтан тұратын тест) нәтижесінде 87.7% көрсеткішке жетті, бұл адам-мамандардан да жоғары!
✔️ Бұрын бірде-бір нейрожелі орындай алмаған логикалық тапсырма бенчмаркін сәтті аяқтады.
🗓 Қазір модель қауіпсіздік тексерісінен өтуде. Қаңтардың соңында жеңілдетілген o3-mini нұсқасы шығады, ал кейін толық o3 нұсқасы жарық көреді.
😉 Бұлар таң қалдырудан жалықпайды екен...