Alec Radford: Otak di Balik GPT-1, GPT-2, dan Revolusi AI Generatif

Alec Radford: Otak di Balik GPT-1, GPT-2, dan Revolusi AI Generatif

 

Alec Radford

Jika ada satu nama di dunia kecerdasan buatan yang layak disebut “pengubah permainan” tetapi jarang muncul di puncak pembicaraan media arus utama, itu adalah Alec Radford — peneliti machine learning yang menjadi penulis utamamakalah GPT pertama di OpenAI, kemudian memimpin evolusi GPT-2 dan mempengaruhi seluruh generasi model bahasa besar (large language models). Kontribusinya mungkin tidak sepopuler CEO atau pimpinan eksekutif Silicon Valley, tetapi bagi mereka yang mengikuti sejarah revolusi AI modern, perannya tidak bisa dilebih-lebihkan.

 

Berbeda dari kebanyakan tokoh teknologi besar yang lahir dari program doktoral bergengsi atau lembaga penelitian universitas elit, Radford mengambil jalan yang sedikit berbeda. Ia menempuh pendidikan di Franklin W. Olin College of Engineering, sebuah perguruan tinggi kecil yang fokus pada teknik di Massachusetts, AS — bukan tempat kampus besar penghasil tech unicorn.

 

Radford tidak mengejar gelar doktor. Alih-alih terjebak dalam dunia akademik tradisional, ia langsung terjun ke praktik rekayasa machine learning — sebuah keputusan yang kemudian akan membawanya ke pusat teknologi AI global. Menurut profil profesionalnya, ia memulai kariernya sebagai peneliti dan insinyur di startup machine learning bernama Indico Data Solutions, yang ia dirikan bersama beberapa kolega pada pertengahan 2010-an.

 

Sebelum kita mengenal GPT, dunia deep learning sudah dibentuk dengan cepat oleh inovasi lain. Di bidang generative adversarial networks (GANs) — teknik komputasi yang memungkinkan komputer menghasilkan gambar realistis — Radford termasuk di garis depan. Ia merupakan penulis utama paper DCGAN (Deep Convolutional GANs) pada 2015, yang menjadi fondasi banyak model image-generation yang kemudian meledak seperti Stable Diffusion dan Midjourney.


Itu adalah pertama kali banyak orang di komunitas AI memperhatikan bakatnya.

 

OpenAI: Memulai Era GPT

Pada 2016, Radford bergabung dengan OpenAI, sebuah laboratorium riset kecerdasan buatan yang saat itu masih relatif kecil — jauh sebelum ChatGPT menjadi kata yang dikenal jutaan orang.

 

OpenAI sendiri didirikan pada 2015 dengan tujuan ambisius: mengembangkan kecerdasan buatan yang aman dan bermanfaat bagi seluruh umat manusia. Tetapi pendekatan awal perusahaan itu lebih fokus pada reinforcement learning dan isu teoritis kecerdasan umum buatan (AGI). Radford, dengan pendekatan eksperimen langsungnya yang berani menerapkan model statistik besar tanpa asumsi domain khusus, memperkenalkan perspektif baru yang kemudian terbukti krusial: pre-training besar pada data teks tanpa label untuk mempelajari bahasa.

 

Makalah pertama tentang GPT — Generative Pre-trained Transformer — diterbitkan pada Juni 2018. Radford adalah penulis utama dalam paper tersebut, yang memperkenalkan metode pre-training skala besar pada model berarsitektur Transformer. Pendekatan ini memanfaatkan jaringan self-attention yang dilahirkan dari makalah “Attention is All You Need”, tetapi dengan skala dan fokus baru: bukan sekadar menerjemahkan atau memahami bahasa alami, melainkan menghasilkan bahasa secara generatif berdasarkan konteks luas.

 

GPT-1 menunjukkan bahwa model yang dilatih secara unsupervised dengan jumlah data teks besar dapat memahami struktur bahasa, pengetahuan dunia, dan konteks dalam cara yang tak terbayangkan sebelumnya. Itu menjadi bukti konsep bahwa language model bisa menjadi dasar untuk sejumlah tugas NLP tanpa memerlukan pelabelan data skenario-spesifik — sebuah ide yang kemudian membentuk seluruh industri large language model.

 

Radford tidak hanya menjadi penulis utama makalah itu, tetapi definisi dan arah projeknya menunjukkan bagaimana cara berpikirnya — pragmatis, berani, dan sangat dipengaruhi oleh eksperimen langsung daripada teori tradisional. Karyanya di GPT memperluas batas pemahaman tentang apa yang model AI bisa pelajari dari teks saja, tanpa intervensi manusia dalam penyusunan dataset tugas tertentu.


GPT-2: Ledakan Besar yang Mengguncang Dunia

 

Setahun setelah GPT-1, OpenAI dan Radford meluncurkan GPT-2, versi lanjutan yang mengubah medan teknologi. Dengan 1,5 miliar parameter — pada masanya ukuran yang sangat besar — GPT-2 mampu menulis artikel, menjawab pertanyaan, serta menghasilkan teks yang sangat koheren dan panjang berdasarkan petunjuk sederhana dari pengguna.

 

Namun yang benar-benar membuat GPT-2 menjadi berita besar bukan hanya kemampuannya, tetapi bagaimana reaksi dunia terhadapnya. OpenAI awalnya tidak merilis model lengkapnya karena kekhawatiran soal potensi penyalahgunaan — misalnya dalam pembuatan berita palsu atau konten berbahaya otomatis. Kebijakan ini memicu debat intens tentang tanggung jawab riset vs. transparansi ilmu pengetahuan.

 

Dalam artikel-artikel teknisnya, Radford dan timnya menunjukkan bahwa GPT-2 mampu melakukan “zero-shot learning” — melakukan sejumlah tugas pemrosesan bahasa tanpa fine-tuning khusus, hanya berdasarkan konteks yang diberikan. Ini merupakan lompatan besar dibanding model sebelumnya yang lebih tergantung pada data pelabelan tugas tertentu.

 

GPT-2 dengan demikian memang bukanlah produk akhir, tetapi titik balik dalam pergeseran paradigma teknologi AI dari eksperimen kecil ke sistem generatif besar yang menentukan masa depan bidang ini.

 

Radford tidak berhenti hanya di model bahasa. Di OpenAI, ia berkontribusi pula pada proyek-proyek lain yang memperluas kemampuan AI ke domain multimodal — menghubungkan bahasa dengan gambar, suara, dan konteks dunia nyata.


Model CLIP (Contrastive Language–Image Pre-training), misalnya, memungkinkan AI memahami hubungan kata dan gambar dalam ruang representasi yang sama. Ini membuka jalan bagi model-model generatif gambar seperti DALL-E yang bisa memproduksi gambar dari deskripsi teks — sebuah karya yang benar-benar merevolusi persepsi publik tentang apa AI bisa lakukan dalam ranah kreatif.

 

Selain itu, Radford juga terlibat dalam pengembangan Whisper, sistem pengenal suara dengan kemampuan transkripsi otomatis yang sangat kuat, memperluas AI ke domain pemahaman audio.

 

Kontribusi-kontribusi ini menunjukkan bahwa visi Radford bukan semata-mata tentang bahasa teks, tetapi tentang menciptakan model generatif yang dapat memahami dan menginterpretasikan dunia dalam banyak modalitas — teks, gambar, suara — dengan cara yang sebelumnya hanya dipahami manusia.

 

Meninggalkan OpenAI

Desember 2024, berita mengejutkan muncul: Radford meninggalkan OpenAI setelah hampir satu dekade menjadi ujung tombak riset internal perusahaan dan arsitek di balik model-model yang mendasari ChatGPT serta teknologi AI modern.

 

Menurut laporan sumber, keputusan itu bukan putus hubungan total, tetapi transisi menuju penelitian independen. Radford dilaporkan ingin mengeksplorasi arah riset yang mungkin lebih lepas dari tekanan korporat, sambil tetap membuka kemungkinan kolaborasi dengan OpenAI maupun lembaga lain.

 

Arah karier selanjutnya belum sepenuhnya jelas, tetapi berdasarkan jejaknya selama ini, kemungkinan besar ia akan terus berkontribusi signifikan pada pemahaman dan ekspansi kecerdasan buatan ke wilayah-wilayah baru, baik teoritis maupun aplikasi nyata.

 

Ketika dunia berbicara tentang ChatGPT, NLP, dan AI generatif, sering kali yang dipanggil ke meja publik bukanlah para peneliti di balik teknologi tersebut, tetapi para CEO, pengusaha, dan tokoh media. Namun di balik label seperti transformer atau large language model — bahkan di balik produk-produk konsumen populer — ada kerja keras berlapis dari ilmuwan seperti Alec Radford. Tanpanya, skenario AI modern mungkin tidak akan seperti sekarang ini: generatif, multimodal, dan mendalam.

 

Dalam sejarah teknologi, ada sedikit momen di mana satu pendekatan teoritis dan eksperimental dapat mengubah jalannya industri. GPT adalah salah satunya, dan Radford adalah nama yang layak dikenang — bukan hanya sebagai penulis makalah, tetapi sebagai seorang pemikir yang memperluas batas apa yang teknologi dapat capai.

 

Alec Radford bukan sekadar ilmuwan AI — dia adalah sosok yang membantu menyusun ulang wilayah teknologi modern. Ia bukan nama household, tetapi karyanya adalah alasan mengapa asisten AI hari ini bisa mengubah cara orang bekerja, belajar, dan berkreasi. Dalam lanskap teknologi yang sering kali dipenuhi jargon dan hype, Radford menunjukkan bahwa kekuatan sejati datang dari pemikiran yang dalam, riset yang teliti, serta keberanian untuk menantang asumsi. Ia dikabarkan menjadi penasehat Thinking Machien Labs, sebuat perusahaan AI milik mantan petinggi Open AI lain, Mira Murati


Ketika industrinya terus bergerak maju dan menghadapi tantangan etika, hukum, dan sosial yang kompleks, warisan kontribusinya akan tetap menjadi infleksi poin penting — bukan hanya dalam teknologi kecerdasan buatan, tetapi dalam bagaimana manusia berpikir tentang pemahaman, kreasi, dan mesin di masa depan.