Alec Radford: Otak di Balik GPT-1, GPT-2, dan Revolusi AI Generatif
Founder
Jika ada satu nama
di dunia kecerdasan buatan yang layak disebut “pengubah permainan” tetapi
jarang muncul di puncak pembicaraan media arus utama, itu adalah Alec
Radford — peneliti machine learning yang menjadi penulis utamamakalah GPT pertama di OpenAI, kemudian memimpin evolusi GPT-2 dan mempengaruhi
seluruh generasi model bahasa besar (large language models).
Kontribusinya mungkin tidak sepopuler CEO atau pimpinan eksekutif Silicon
Valley, tetapi bagi mereka yang mengikuti sejarah revolusi AI modern, perannya
tidak bisa dilebih-lebihkan.
Berbeda dari kebanyakan tokoh teknologi besar yang lahir dari program doktoral bergengsi atau lembaga penelitian universitas elit, Radford mengambil jalan yang sedikit berbeda. Ia menempuh pendidikan di Franklin W. Olin College of Engineering, sebuah perguruan tinggi kecil yang fokus pada teknik di Massachusetts, AS — bukan tempat kampus besar penghasil tech unicorn.
Radford tidak
mengejar gelar doktor. Alih-alih terjebak dalam dunia akademik tradisional, ia
langsung terjun ke praktik rekayasa machine learning — sebuah keputusan
yang kemudian akan membawanya ke pusat teknologi AI global. Menurut profil
profesionalnya, ia memulai kariernya sebagai peneliti dan insinyur di startup machine
learning bernama Indico Data Solutions, yang ia dirikan bersama
beberapa kolega pada pertengahan 2010-an.
Sebelum kita
mengenal GPT, dunia deep learning sudah dibentuk dengan cepat oleh
inovasi lain. Di bidang generative adversarial networks (GANs) —
teknik komputasi yang memungkinkan komputer menghasilkan gambar realistis —
Radford termasuk di garis depan. Ia merupakan penulis utama paper DCGAN
(Deep Convolutional GANs) pada 2015, yang menjadi fondasi banyak model
image-generation yang kemudian meledak seperti Stable Diffusion dan Midjourney.
Itu adalah pertama
kali banyak orang di komunitas AI memperhatikan bakatnya.
OpenAI: Memulai Era GPT
Pada 2016, Radford
bergabung dengan OpenAI, sebuah laboratorium riset kecerdasan buatan
yang saat itu masih relatif kecil — jauh sebelum ChatGPT menjadi kata yang
dikenal jutaan orang.
OpenAI sendiri
didirikan pada 2015 dengan tujuan ambisius: mengembangkan kecerdasan buatan
yang aman dan bermanfaat bagi seluruh umat manusia. Tetapi pendekatan awal
perusahaan itu lebih fokus pada reinforcement learning dan isu teoritis
kecerdasan umum buatan (AGI). Radford, dengan pendekatan eksperimen
langsungnya yang berani menerapkan model statistik besar tanpa asumsi domain
khusus, memperkenalkan perspektif baru yang kemudian terbukti krusial: pre-training
besar pada data teks tanpa label untuk mempelajari bahasa.
Makalah pertama
tentang GPT — Generative Pre-trained Transformer — diterbitkan pada Juni
2018. Radford adalah penulis utama dalam paper tersebut, yang memperkenalkan
metode pre-training skala besar pada model berarsitektur Transformer.
Pendekatan ini memanfaatkan jaringan self-attention yang dilahirkan dari
makalah “Attention is All You Need”, tetapi dengan skala dan fokus baru: bukan
sekadar menerjemahkan atau memahami bahasa alami, melainkan menghasilkan
bahasa secara generatif berdasarkan konteks luas.
GPT-1 menunjukkan
bahwa model yang dilatih secara unsupervised dengan jumlah data teks
besar dapat memahami struktur bahasa, pengetahuan dunia, dan konteks dalam cara
yang tak terbayangkan sebelumnya. Itu menjadi bukti konsep bahwa language
model bisa menjadi dasar untuk sejumlah tugas NLP tanpa memerlukan
pelabelan data skenario-spesifik — sebuah ide yang kemudian membentuk seluruh
industri large language model.
Radford tidak
hanya menjadi penulis utama makalah itu, tetapi definisi dan arah projeknya
menunjukkan bagaimana cara berpikirnya — pragmatis, berani, dan sangat
dipengaruhi oleh eksperimen langsung daripada teori tradisional. Karyanya di
GPT memperluas batas pemahaman tentang apa yang model AI bisa pelajari dari teks
saja, tanpa intervensi manusia dalam penyusunan dataset tugas tertentu.
GPT-2: Ledakan Besar yang Mengguncang
Dunia
Setahun setelah
GPT-1, OpenAI dan Radford meluncurkan GPT-2, versi lanjutan yang
mengubah medan teknologi. Dengan 1,5 miliar parameter — pada masanya ukuran
yang sangat besar — GPT-2 mampu menulis artikel, menjawab pertanyaan, serta
menghasilkan teks yang sangat koheren dan panjang berdasarkan petunjuk
sederhana dari pengguna.
Namun yang
benar-benar membuat GPT-2 menjadi berita besar bukan hanya kemampuannya, tetapi
bagaimana reaksi dunia terhadapnya. OpenAI awalnya tidak merilis
model lengkapnya karena kekhawatiran soal potensi penyalahgunaan — misalnya
dalam pembuatan berita palsu atau konten berbahaya otomatis. Kebijakan ini
memicu debat intens tentang tanggung jawab riset vs. transparansi ilmu
pengetahuan.
Dalam
artikel-artikel teknisnya, Radford dan timnya menunjukkan bahwa GPT-2 mampu
melakukan “zero-shot learning” — melakukan sejumlah tugas pemrosesan bahasa
tanpa fine-tuning khusus, hanya berdasarkan konteks yang diberikan. Ini
merupakan lompatan besar dibanding model sebelumnya yang lebih tergantung pada
data pelabelan tugas tertentu.
GPT-2 dengan
demikian memang bukanlah produk akhir, tetapi titik balik dalam
pergeseran paradigma teknologi AI dari eksperimen kecil ke sistem generatif
besar yang menentukan masa depan bidang ini.
Radford tidak
berhenti hanya di model bahasa. Di OpenAI, ia berkontribusi pula pada
proyek-proyek lain yang memperluas kemampuan AI ke domain multimodal —
menghubungkan bahasa dengan gambar, suara, dan konteks dunia nyata.
Model CLIP (Contrastive
Language–Image Pre-training), misalnya, memungkinkan AI memahami hubungan
kata dan gambar dalam ruang representasi yang sama. Ini membuka jalan bagi
model-model generatif gambar seperti DALL-E yang bisa memproduksi gambar
dari deskripsi teks — sebuah karya yang benar-benar merevolusi persepsi publik
tentang apa AI bisa lakukan dalam ranah kreatif.
Selain itu, Radford
juga terlibat dalam pengembangan Whisper, sistem pengenal suara dengan
kemampuan transkripsi otomatis yang sangat kuat, memperluas AI ke domain
pemahaman audio.
Kontribusi-kontribusi
ini menunjukkan bahwa visi Radford bukan semata-mata tentang bahasa teks,
tetapi tentang menciptakan model generatif yang dapat memahami dan
menginterpretasikan dunia dalam banyak modalitas — teks, gambar, suara — dengan
cara yang sebelumnya hanya dipahami manusia.
Meninggalkan OpenAI
Desember 2024,
berita mengejutkan muncul: Radford meninggalkan OpenAI setelah hampir
satu dekade menjadi ujung tombak riset internal perusahaan dan arsitek di balik
model-model yang mendasari ChatGPT serta teknologi AI modern.
Menurut laporan
sumber, keputusan itu bukan putus hubungan total, tetapi transisi menuju penelitian
independen. Radford dilaporkan ingin mengeksplorasi arah riset yang mungkin
lebih lepas dari tekanan korporat, sambil tetap membuka kemungkinan kolaborasi
dengan OpenAI maupun lembaga lain.
Arah karier
selanjutnya belum sepenuhnya jelas, tetapi berdasarkan jejaknya selama ini,
kemungkinan besar ia akan terus berkontribusi signifikan pada pemahaman dan
ekspansi kecerdasan buatan ke wilayah-wilayah baru, baik teoritis maupun
aplikasi nyata.
Ketika dunia
berbicara tentang ChatGPT, NLP, dan AI generatif, sering kali yang
dipanggil ke meja publik bukanlah para peneliti di balik teknologi tersebut,
tetapi para CEO, pengusaha, dan tokoh media. Namun di balik label seperti transformer
atau large language model — bahkan di balik produk-produk konsumen
populer — ada kerja keras berlapis dari ilmuwan seperti Alec Radford.
Tanpanya, skenario AI modern mungkin tidak akan seperti sekarang ini:
generatif, multimodal, dan mendalam.
Dalam sejarah
teknologi, ada sedikit momen di mana satu pendekatan teoritis dan eksperimental
dapat mengubah jalannya industri. GPT adalah salah satunya, dan Radford
adalah nama yang layak dikenang — bukan hanya sebagai penulis makalah, tetapi
sebagai seorang pemikir yang memperluas batas apa yang teknologi dapat capai.
Alec Radford bukan
sekadar ilmuwan AI — dia adalah sosok yang membantu menyusun ulang wilayah
teknologi modern. Ia bukan nama household, tetapi karyanya adalah alasan
mengapa asisten AI hari ini bisa mengubah cara orang bekerja, belajar, dan
berkreasi. Dalam lanskap teknologi yang sering kali dipenuhi jargon dan hype,
Radford menunjukkan bahwa kekuatan sejati datang dari pemikiran yang dalam,
riset yang teliti, serta keberanian untuk menantang asumsi. Ia dikabarkan menjadi penasehat Thinking Machien Labs, sebuat perusahaan AI milik mantan petinggi Open AI lain, Mira Murati
Ketika industrinya
terus bergerak maju dan menghadapi tantangan etika, hukum, dan sosial yang
kompleks, warisan kontribusinya akan tetap menjadi infleksi poin penting —
bukan hanya dalam teknologi kecerdasan buatan, tetapi dalam bagaimana manusia
berpikir tentang pemahaman, kreasi, dan mesin di masa depan.
