Dipublikasikan: 17 Juni 2026 · 1 menit baca

Startup Bikin AI yang Lebih Reliable Tanpa Pakai Model Terbesar

Startup Probably dapet 9 juta dolar buat bikin AI yang reliable. Kuncinya bukan model lebih pinter, tapi sistem yang nge-wrap LLM pakai validator.

Hallucination masih jadi masalah paling bikin capek di AI. Lo pakai LLM buat dapet jawaban, tapi kadang jawabannya ngawur. Dan lo gak tau kapan itu terjadi.

Startup bernama Probably baru aja dapet 9 juta dolar seed funding dari Andreessen Horowitz. Mereka punya pendekatan yang menarik buat solve masalah ini.

Bukan bikin model lebih pinter

Yang dilakuin Probably itu kebalikan dari kebanyakan startup AI. Mereka gak berusaha bikin model yang lebih powerful. Mereka justru bikin sistem yang nge-wrap LLM pakai validator.

Cara kerjanya gini. LLM kasih jawaban pertama. Terus ada validator yang ngecek jawaban itu. Kalau cocok, fine. Kalau gak cocok, dikembalikan ke LLM lagi. Dan LLM-nya dilatih dari hasil validasi itu.

Peter Elias, founder Probably, bilang sesuatu yang cukup provokatif. Semakin bagus harness engineering lo, semakin lemah model yang lo butuhin.

Hasilnya cukup mengejutkan

Versi yang sekarang jalan di model yang emang lemah. Empat kelas di bawah model frontier. Tapi karena harness-nya bagus, hasilnya tetep akurat. Dan yang paling penting, model ini bisa jalan di desktop biasa. Gak perlu data center.

Ini artinya token cost bisa turun drastis. Di saat banyak customer mulai mikir ulang soal budget AI, solusi kayak gini jadi makin relevan.

Kenapa lab gak lakuin ini

Ada alasan kenapa perusahaan AI besar gak terlalu semangat bikin sistem kayak gini. Kalau model lo sering salah, user harus panggil lagi buat koreksi. Lebih banyak call berarti lebih banyak duit.

Probably main di celah yang berbeda. Mereka kasih reliability tinggi tanpa harus pake frontier model. Dan use case-nya bisa ke mana-mana. Sekarang fokus di data science, tapi bisa extend ke akuntansi, medis, atau bidang lain yang butuh ketelitian tinggi.


Sumber asli: Probably raises $9M to build a more reliable kind of AI - TechCrunch