ChatGPT, OpenAI tarafından geliştirilen ve diyalog konusunda uzmanlaşmış bir yapay zeka sohbet botudur. Bu chatbot, denetimli ve takviyeli öğrenme teknikleriyle ince ayar yapılmış büyük bir dil modeline dayanır. ChatGPT'nin ilk versiyonu, GPT-3 temelli idi ve daha sonra gelişmiş sürümleri olan GPT-3.5 ve 14 Mart 2023'te GPT-4 ile güncellenmiştir ve ChatGPT Plus kullanıcıları için kullanılabilir durumdadır. 13 Mayıs 2024 itibarıyla OpenAI, ChatGPT'nin yeni dil modeli GPT-4o'yu Plus abonesi olmayan kullanıcıların da kısıtlı olarak kullanabileceğini açıkladı.[2] Açıklamaya göre ChatGPT Plus abonesi olmayan kullanıcılar da yeni GPT-4o modelini bir günlük kota ile kullanabilecek. Kota dolunca tekrar GPT-3.5 modeline dönecekler. OpenAI, ChatGPT'yi Kasım 2022'de kullanıma sundu ve Ocak 2023 itibarıyla 100 milyondan fazla kullanıcıya ulaştığı bildirildi.[3] Bu geniş kullanıcı tabanı, ChatGPT'nin dil modeli alanında önemli bir yenilik olduğunu göstermektedir. Eğitim ChatGPT, denetimli öğrenme ve pekiştirmeli öğrenme kullanılarak GPT-3.5'e ek olarak ayarlandı.[4] Her iki yaklaşım da modelin performansını iyileştirmek için insan eğitmenleri kullandı. Denetimli öğrenme durumunda modele, eğitmenlerin her iki tarafı da oynadığı konuşmalar sağlandı. Pekiştirme adımında, insan eğitmenleri önce modelin önceki bir konuşmada oluşturduğu yanıtları sıraladı. Bu sıralamalar, Yakın Politika Optimizasyonunun (PPO) birkaç yinelemesi kullanılarak modelin daha da ince ayarlandığı 'ödül modelleri' oluşturmak için kullanıldı.[5][6] Yakın Politika Optimizasyonu algoritmaları, bölge politikası optimizasyon algoritmalarına güvenmek için uygun maliyetli bir fayda sunar ve hesaplama açısından pahalı işlemlerin çoğunu daha hızlı performansla ortadan kaldırırlar.[7] Modeller, Azure süper bilgi işlem altyapılarında Microsoft ile iş birliği içinde eğitilmiş olabilir. Ayrıca OpenAI, ChatGPT'yi daha fazla eğitmek ve ince ayar yapmak için kullanılabilecek ChatGPT kullanıcılarından veri toplamaya devam ediyor. Kullanıcıların, ChatGPT'den aldıkları yanıtlara olumlu veya olumsuz oy vermelerine izin veriliyor; olumlu veya olumsuz oylama üzerine, ek geri bildirim içeren bir metin alanını da doldurabiliyorlar.[8]

Caner Doğan
Test
Caner Doğan
Test