Ilustrasi jaringan saraf tiruan dengan node dan koneksi bercahaya biru

Glosarium AI: Istilah Penting yang Wajib Kamu Pahami

Penulis:Nur Hamzah
Terbit:
Diperbarui:
⏱️7 menit membaca
Bagikan:
  • Glosarium AI yang mencakup istilah penting seperti AGI, LLM, dan hallucination
  • Definisi sederhana untuk istilah teknis seperti chain of thought, distillation, dan fine-tuning
  • Penjelasan tentang konsep seperti AI agent, coding agent, dan reinforcement learning
  • Istilah infrastruktur seperti compute, parallelization, dan memory cache
  • Informasi tentang model arsitektur seperti Mixture of Experts (MoE) dan Model Context Protocol (MCP)

Telset.id – Kecerdasan buatan (AI) kini mengubah dunia, sekaligus menciptakan bahasa baru untuk menjelaskan cara kerjanya. Istilah seperti LLM, RAG, dan RLHF sering muncul di rapat produk, presentasi, atau panel diskusi, membuat banyak orang di industri teknologi merasa tertinggal. Glosarium ini hadir untuk menjembatani kesenjangan tersebut dengan definisi sederhana dalam bahasa Indonesia.

Artikel ini adalah dokumen hidup yang diperbarui secara berkala, sebagaimana sistem AI yang terus berkembang. Berikut adalah istilah-istilah AI yang paling sering kamu temui, baik saat membangun produk, berinvestasi, atau sekadar mengikuti berita teknologi.

AGI (Artificial General Intelligence) adalah istilah yang masih kabur, tetapi secara umum merujuk pada AI yang lebih mampu daripada rata-rata manusia di sebagian besar tugas. CEO OpenAI Sam Altman pernah menggambarkannya sebagai “setara dengan manusia biasa yang bisa kamu pekerjakan sebagai rekan kerja.” Sementara itu, piagam OpenAI mendefinisikan AGI sebagai “sistem otonom yang mengungguli manusia dalam pekerjaan yang bernilai ekonomi.” Google DeepMind memiliki pemahaman berbeda, yaitu “AI yang setidaknya sama mampu dengan manusia dalam sebagian besar tugas kognitif.”

AI Agent adalah alat yang menggunakan teknologi AI untuk melakukan serangkaian tugas atas namamu, seperti mengisi biaya perjalanan, memesan tiket, atau menulis kode. Berbeda dengan chatbot dasar, AI agent bersifat otonom dan dapat menggunakan beberapa sistem AI untuk menyelesaikan tugas multi-langkah. Namun, infrastruktur untuk mewujudkan kemampuan ini masih terus dibangun.

API Endpoints dapat dibayangkan sebagai “tombol” di bagian belakang sebuah perangkat lunak yang bisa ditekan oleh program lain. Pengembang menggunakan antarmuka ini untuk membangun integrasi, misalnya menarik data dari aplikasi lain atau memungkinkan AI agent mengontrol layanan pihak ketiga. Seiring kemampuan AI agent yang meningkat, mereka semakin mampu menemukan dan menggunakan endpoint ini secara mandiri.

Chain of Thought adalah teknik penalaran yang memecah masalah menjadi langkah-langkah kecil untuk meningkatkan kualitas hasil akhir. Dalam konteks AI, model bahasa besar yang menggunakan chain-of-thought reasoning biasanya membutuhkan waktu lebih lama untuk menjawab, tetapi jawabannya lebih mungkin benar, terutama dalam konteks logika atau pengkodean. Model penalaran dikembangkan dari model bahasa besar tradisional dan dioptimalkan untuk pemikiran rantai-pemikiran berkat reinforcement learning.

Coding Agent adalah versi khusus dari AI agent yang diterapkan pada pengembangan perangkat lunak. Alih-alih hanya menyarankan kode untuk ditinjau manusia, coding agent dapat menulis, menguji, dan men-debug kode secara otonom. Bayangkan seperti mempekerjakan staf magang yang sangat cepat, tidak pernah tidur, dan tidak pernah kehilangan fokus, meskipun manusia tetap perlu meninjau hasil kerjanya.

Compute merujuk pada kekuatan komputasi vital yang memungkinkan model AI beroperasi. Istilah ini sering menjadi singkatan untuk perangkat keras seperti GPU, CPU, dan TPU yang menjadi fondasi industri AI modern.

Deep Learning adalah subset dari machine learning yang menggunakan struktur jaringan saraf tiruan (neural network) berlapis-lapis. Struktur ini memungkinkan algoritma membuat korelasi yang lebih kompleks dibandingkan sistem machine learning sederhana. Deep learning mengambil inspirasi dari jalur neuron yang saling terhubung di otak manusia, namun membutuhkan banyak titik data (jutaan atau lebih) dan waktu pelatihan yang lebih lama.

Diffusion adalah teknologi inti di balik banyak model AI penghasil gambar, musik, dan teks. Terinspirasi dari fisika, sistem diffusion perlahan “menghancurkan” struktur data dengan menambahkan noise hingga tidak ada yang tersisa. Sistem ini kemudian mempelajari proses “reverse diffusion” untuk memulihkan data dari noise tersebut.

Distillation adalah teknik untuk mengekstrak pengetahuan dari model AI besar menggunakan model “guru-murid.” Pengembang mengirim permintaan ke model guru dan mencatat keluarannya, yang kemudian digunakan untuk melatih model murid agar meniru perilaku guru. Teknik ini memungkinkan pembuatan model yang lebih kecil dan efisien dengan kehilangan minimal, dan kemungkinan digunakan oleh OpenAI untuk mengembangkan GPT-4 Turbo.

Fine-Tuning adalah pelatihan lanjutan model AI untuk mengoptimalkan kinerja pada tugas atau area yang lebih spesifik. Banyak startup AI menggunakan model bahasa besar sebagai titik awal, kemudian menyempurnakannya dengan data khusus domain untuk meningkatkan utilitas bagi sektor target.

GAN (Generative Adversarial Network) adalah kerangka machine learning yang mendasari perkembangan penting dalam AI generatif, termasuk alat deepfake. GAN menggunakan sepasang jaringan saraf: generator berusaha menghasilkan output yang realistis, sementara diskriminator berusaha mendeteksi data buatan. Kompetisi terstruktur ini mengoptimalkan output AI menjadi lebih realistis tanpa intervensi manusia tambahan.

Hallucination adalah istilah industri AI untuk model yang membuat informasi palsu. Ini adalah masalah besar bagi kualitas AI karena dapat menghasilkan output yang menyesatkan dan berpotensi berbahaya, misalnya saran medis yang salah. Halusinasi mendorong pengembangan model AI vertikal yang lebih terspesialisasi untuk mengurangi risiko kesenjangan pengetahuan.

Inference adalah proses menjalankan model AI, yaitu membiarkan model membuat prediksi atau menarik kesimpulan dari data yang pernah dilihatnya. Inference tidak dapat terjadi tanpa training; model harus mempelajari pola data terlebih dahulu. Banyak jenis perangkat keras dapat melakukan inference, mulai dari prosesor ponsel hingga GPU khusus.

Large Language Model (LLM) adalah model AI yang digunakan oleh asisten AI populer seperti ChatGPT, Claude, Google Gemini, dan Meta AI Llama. LLM adalah jaringan saraf dalam yang terdiri dari miliaran parameter numerik yang mempelajari hubungan antara kata dan frasa. Model ini dibuat dari pola yang ditemukan di miliaran buku, artikel, dan transkrip.

Memory Cache adalah teknik optimasi untuk meningkatkan efisiensi inference. Caching menyimpan kalkulasi tertentu untuk digunakan kembali pada permintaan pengguna di masa depan, sehingga mengurangi jumlah kalkulasi yang harus dijalankan model. Salah satu jenis caching yang terkenal adalah KV (key value) caching yang bekerja pada model berbasis transformer.

Model Context Protocol (MCP) adalah standar terbuka yang memungkinkan model AI terhubung ke alat dan data eksternal seperti file, database, atau aplikasi Slack dan Google Drive. Diperkenalkan oleh Anthropic pada 2024 dan kemudian diserahkan ke Linux Foundation, MCP telah diadopsi oleh OpenAI, Google, dan Microsoft.

Mixture of Experts (MoE) adalah arsitektur model yang membagi jaringan saraf menjadi banyak sub-jaringan spesialis kecil dan hanya mengaktifkan sebagian kecil untuk setiap tugas. MoE memiliki “router” bawaan yang memilih spesialis yang tepat untuk pekerjaan tertentu, memungkinkan pembuatan model besar yang tetap cepat dan murah dijalankan.

Neural Network adalah struktur algoritmik berlapis yang mendasari deep learning dan ledakan alat AI generatif. Meskipun idenya berasal dari tahun 1940-an, kebangkitan perangkat keras GPU dari industri video game benar-benar membuka kekuatan teori ini, memungkinkan jaringan saraf mencapai kinerja lebih baik di berbagai domain.

Open Source merujuk pada perangkat lunak atau model AI yang kode sumbernya tersedia untuk umum. Di dunia AI, model keluarga Llama dari Meta adalah contoh menonjol. Pendekatan ini memungkinkan peneliti dan pengembang di seluruh dunia membangun di atas karya satu sama lain dan melakukan audit keamanan independen.

Parallelization berarti melakukan banyak hal secara bersamaan. Dalam AI, paralelisasi fundamental untuk training dan inference. GPU modern dirancang khusus untuk melakukan ribuan kalkulasi secara paralel, menjadi tulang punggung perangkat keras industri AI.

RAMageddon adalah istilah untuk tren kekurangan chip RAM yang melanda industri teknologi. Perusahaan teknologi besar dan laboratorium AI membeli RAM dalam jumlah besar untuk pusat data mereka, menyebabkan kelangkaan dan kenaikan harga yang memengaruhi industri game, elektronik konsumen, dan komputasi perusahaan.

Recursive Self-Improvement (RSI) adalah ambang batas seberapa cerdas AI bisa menjadi dan seberapa sedikit bergantung pada manusia. Dalam skenario RSI, model AI mulai meningkatkan diri mereka sendiri tanpa intervensi manusia, menyebabkan percepatan besar dalam kemampuan dan otonomi. Beberapa startup AI kini berusaha membangun model yang dapat memperbaiki diri secara rekursif.

Reinforcement Learning adalah cara melatih AI di mana sistem belajar dengan mencoba hal-hal dan menerima hadiah untuk jawaban yang benar. Tidak seperti supervised learning, reinforcement learning memungkinkan model menjelajahi lingkungannya dan terus memperbarui perilaku berdasarkan umpan balik. Teknik RLHF (reinforcement learning from human feedback) kini penting untuk menyempurnakan model agar lebih membantu dan aman.

Token adalah blok bangunan dasar komunikasi manusia-AI. Token dibuat melalui proses tokenization yang memecah teks mentah menjadi unit-unit kecil yang dapat dicerna model bahasa. Dalam pengaturan perusahaan, token juga menentukan biaya karena sebagian besar perusahaan AI membebankan biaya per token untuk penggunaan LLM.

Token Throughput adalah ukuran seberapa banyak pekerjaan AI yang dapat ditangani suatu sistem dalam periode waktu tertentu. Token throughput yang tinggi adalah tujuan utama tim infrastruktur AI karena menentukan berapa banyak pengguna yang dapat dilayani model secara bersamaan dan seberapa cepat respons diberikan.

Training adalah proses pengembangan AI machine learning di mana data dimasukkan agar model dapat belajar dari pola dan menghasilkan output yang berguna. Pelatihan bisa mahal karena membutuhkan banyak input, dan volume yang diperlukan terus meningkat. Pendekatan hibrida seperti fine-tuning dapat membantu mengelola biaya.

Transfer Learning adalah teknik di mana model AI yang telah dilatih sebelumnya digunakan sebagai titik awal untuk mengembangkan model baru untuk tugas yang berbeda namun terkait. Ini dapat mendorong efisiensi dengan mempercepat pengembangan model dan berguna ketika data untuk tugas tertentu terbatas.

Validation Loss adalah angka yang menunjukkan seberapa baik model AI belajar selama pelatihan. Peneliti melacaknya untuk memutuskan kapan berhenti pelatihan atau menyelidiki potensi masalah. Salah satu kekhawatiran utama yang dibantu oleh validation loss adalah overfitting, di mana model menghafal data pelatihan alih-alih benar-benar belajar pola.

Weights (bobot) adalah inti dari pelatihan AI karena menentukan seberapa penting fitur yang berbeda dalam data. Bobot adalah parameter numerik yang mendefinisikan apa yang paling menonjol dalam dataset untuk tugas pelatihan tertentu. Pelatihan model biasanya dimulai dengan bobot yang ditetapkan secara acak, kemudian menyesuaikan seiring proses berlangsung untuk menghasilkan output yang lebih akurat.

Ikuti Telset.id di Google NewsFollow

Komentar

Belum ada komentar.