Catatan Editor: Teknologi kecerdasan buatan berkembang dengan pesat, dan ada banyak perusahaan rintisan di bidang kecerdasan buatan yang menonjol. Dalam artikel ini, mari kita lihat startup AI menjanjikan mana yang telah diambil oleh investor seperti Sequoia Capital dan Kleiner Perkins Caufield & Byers. Artikel ini merupakan hasil kompilasi dan semoga dapat menginspirasi Anda.
Jika Anda hanya punya waktu beberapa menit, berikut adalah startup paling menarik tentang kecerdasan buatan yang harus diketahui oleh investor, operator, dan pendiri.
Meningkatkan kesehatan manusia. Startup menggunakan teknologi kecerdasan buatan untuk meningkatkan hasil medis dan merancang perawatan baru. Misalnya, perusahaan Alife menggunakan kecerdasan buatan untuk meningkatkan perawatan fertilisasi in vitro dan memberikan pasien peluang lebih besar untuk hamil. Seiring waktu, pendekatan perusahaan dapat mengubah struktur biaya industri secara mendasar. NewLimit adalah startup layanan kesehatan lain yang memanfaatkan teknologi AI. Tim perusahaan mencari cara yang lebih baik untuk mengobati penyakit membandel yang sebelumnya sulit diobati.
Biarkan kecerdasan buatan melayani perusahaan. Sebagian besar produk AI generatif ditujukan untuk konsumen. Pengguna internet biasa kini dapat bermain dengan model kompleks dan membuat teks dan gambar. Beberapa perusahaan yang menjanjikan kini menangani kebutuhan perusahaan secara lebih langsung, membangun produk yang menggabungkan data internal sesuai dengan pedoman perusahaan. Glean, Lamini, Dust dan Lance adalah perwakilan dari tren ini.
Gunakan AI untuk membatasi AI. Revolusi AI mungkin membawa banyak peluang baru, namun juga membawa banyak ancaman. Secara khusus, AI generatif memudahkan pembuatan pesan tertulis yang nyata, meningkatkan jumlah dan kecanggihan penipuan "spear phishing", yang dirancang untuk memperoleh informasi pribadi dari penerima. Perusahaan seperti Abnormal Security dapat menggunakan kecerdasan buatan untuk mendeteksi pesan AI berbahaya guna mencegah serangan tersebut.
*Startup AI tersebar di seluruh dunia. Meskipun Amerika Serikat adalah rumah bagi banyak raksasa industri seperti OpenAI dan Google, startup yang menjanjikan bermunculan di seluruh dunia. Mistral sedang membangun model bahasa open source berskala besar di kantor pusatnya di Paris, dan salah satu pendirinya yakin mereka akan menyaingi OpenAI. Perusahaan Jerman Sereact juga telah mengembangkan produk robot kecerdasan buatan yang mengesankan dan menandatangani kontrak dengan raksasa industri.
Kecerdasan buatan menjadi benang merah kisah teknologi tahun ini. Sejak seri “Untuk Ditonton dalam AI” yang terakhir, bidang ini terus menarik modal, bakat, dan perhatian. Tentu saja, tidak semua perhatian bersifat positif. Meskipun ada kegembiraan yang meluas mengenai kemampuan teknologi ini, selama empat bulan terakhir para pelaku industri terkemuka telah menyatakan keprihatinan mereka dan regulator telah mulai merancang beberapa perlindungan. Dalam beberapa bulan dan tahun mendatang, kecerdasan buatan akan memberikan dampak besar pada kehidupan kita dan menciptakan pemenang dan pecundang baru di seluruh dunia.
Seri "Untuk Ditonton" kami dirancang untuk membantu pembaca bersiap menghadapi masa depan dan membayangkan masa depan dengan lebih jelas. Ini adalah titik awal yang baik bagi mereka yang ingin memahami teknologi yang muncul di bidang kecerdasan buatan dan memanfaatkan perubahan yang terjadi. Untuk melakukan hal ini, kami mengundang investor dan pendiri paling mengesankan di bidang kecerdasan buatan untuk memperkenalkan startup yang mereka yakini paling menjanjikan.
1. Hidup
Menggunakan kecerdasan buatan untuk meningkatkan teknologi IVF
Dalam setiap proses reproduksi, ada saat-saat yang memerlukan pengambilan keputusan oleh manusia, dan dua kaitan paling relevan dengan IVF adalah "stimulasi ovarium" dan "seleksi embrio".
"Stimulasi ovarium" mengacu pada penentuan dosis obat yang diterima pasien untuk merangsang pertumbuhan folikel di ovarium, dan kapan harus memberikan suntikan pemicu untuk merangsang folikel melepaskan sel telur. Pemilihan waktu pemicu sangat penting; jika terlalu dini, Anda mungkin mendapatkan telur yang belum matang; jika terlambat, Anda mungkin mendapatkan telur yang terlalu matang, atau Anda mungkin tidak mendapatkan telur sebanyak mungkin.
"Seleksi embrio" mengacu pada pemilihan sel telur yang telah dibuahi untuk digunakan dan ditanamkan. Saat ini, dokter dan ahli embriologi, seperti kebanyakan profesional medis, mendasarkan keputusan mereka pada kombinasi pengalaman dan pelatihan mereka sendiri, sistem penilaian morfologi, dan trial and error. Jika dosis atau waktunya tidak tepat dalam satu siklus, mereka akan menyesuaikannya pada siklus berikutnya. Hal ini memerlukan kompetensi profesional dokter yang sangat tinggi, dan pada saat ini, dokter memiliki tingkat keterampilan yang berbeda-beda, dan keterampilan mereka sangat penting untuk mencapai hasil. Untuk kesuburan, pasar yang pasokannya sangat terbatas, hal ini berarti harganya yang mahal, terutama jika Anda ingin melihat hasil yang optimal.
Alife sedang membangun alat kecerdasan buatan untuk meningkatkan hasil fertilisasi in vitro (IVF). Perusahaan ini menggunakan alat kecerdasan buatan untuk memberi para praktisi “kekuatan super” guna meningkatkan akurasi pengambilan keputusan mereka dengan memanfaatkan kumpulan data masukan dan hasil yang sangat besar. Kini, melalui antarmuka sederhana, dokter dapat memasukkan karakteristik pasien dan menerima rekomendasi tepat pada momen-momen penting dalam perjalanan kesuburan, yang diperoleh dari hasil ribuan siklus sebelumnya. Kumpulan data ini berasal dari sejumlah besar informasi pasien yang sudah ada, dan menjadi lebih baik seiring setiap pasien menggunakan produk Alife.
Alat-alat ini akan mengubah sifat industri kesuburan. Penelitian Alife menunjukkan bahwa model pembelajaran mesin mereka dapat membantu dokter mengoptimalkan 50% waktu pemicuan dan membantu mengambil rata-rata tiga sel telur yang lebih matang, dua sel telur yang telah dibuahi, dan satu embrio lagi. Produk Alife secara signifikan dapat memperluas akses terhadap perawatan infertilitas, mengurangi biaya per pasien dengan mengurangi dosis obat yang diperlukan dan meningkatkan tingkat keberhasilan siklus IVF. Hal ini juga akan memberikan kesempatan yang sama bagi para dokter, memberikan mereka yang tidak memiliki pengalaman langsung, akses terhadap pengetahuan dan informasi yang lebih luas.
Pada akhirnya, Anda dapat membayangkan alat Alife menyediakan semua informasi untuk momen-momen penting dalam suatu proses dan memungkinkan praktisi selain dokter untuk melakukan operasi, sehingga secara signifikan mengubah struktur biaya dan ketersediaan industri. Terlebih lagi, pengobatan presisi berbasis data, yang menambah (atau akhirnya menggantikan) penilaian seseorang dengan rekomendasi yang dipersonalisasi, tidak hanya terjadi di dunia IVF. Ada ribuan momen seperti ini dalam bidang kedokteran, saat kita memiliki kesempatan untuk menggunakan data untuk mengubah hasil dan akses terhadap prosedur dan perawatan penting secara signifikan.
—Rebecca Kaden, mitra umum, Union Square Ventures
2. Kumpulkan
Pencarian Perusahaan
Di tempat kerja, menemukan informasi yang Anda perlukan saat Anda membutuhkannya seharusnya cepat dan mudah. Karena setiap orang menggunakan banyak aplikasi untuk menyelesaikan pekerjaannya, dan sebagai hasilnya menghasilkan banyak data dan dokumen, hal ini tidak selalu terjadi. Ketika “pengetahuan” tumbuh secara eksponensial dan sifat pekerjaan semakin terdistribusi, dibutuhkan waktu yang lebih lama untuk menemukan pengetahuan yang ada. Dengan kata lain, cukup sulit untuk “mencari sesuatu” di tempat kerja.
Untuk membantu perusahaan mengatasi masalah ini, Arvind Jain dan timnya membangun Glean, sebuah platform pencarian tempat kerja terpadu yang didukung AI. Ini membekali karyawan dengan asisten kerja intuitif yang membantu mereka menemukan apa yang mereka butuhkan dan secara proaktif menemukan apa yang harus mereka ketahui.
Misi perusahaan ini sederhana sejak awal: membantu orang menemukan jawaban atas semua pertanyaan di tempat kerja dengan lebih cepat, dengan lebih sedikit rasa frustrasi dan waktu yang terbuang. Namun hasil perusahaan kemudian berkembang jauh melampaui pencarian. Misalnya, Glean tidak hanya menelusuri semua aplikasi dan basis pengetahuan di tempat kerja (Slack, Teams, Google Drive, Figma, Dropbox, Coda, dll.), namun juga memahami bahasa dan konteks alami, berdasarkan peran orang-orang di dalam/di luar perusahaan. Hubungan mempersonalisasi interaksi pengguna. Ini dengan cerdas menampilkan informasi perusahaan Anda yang paling populer dan terverifikasi, membantu Anda menemukan apa yang diketahui tim Anda dan tetap konsisten, semuanya dengan cara yang diizinkan.
Ketika organisasi menjadi lebih terdistribusi dan pengetahuan menjadi lebih terfragmentasi, asisten kerja yang intuitif seperti Glean tidak lagi menjadi alat yang bagus untuk dimiliki, namun menjadi alat yang penting untuk meningkatkan produktivitas karyawan. Pertumbuhan perusahaan akan meruntuhkan hambatan yang menghambat kemajuan dan menciptakan pengalaman kerja yang lebih positif dan produktif.
Selain itu, teknologi pencarian Glean memungkinkannya menghadirkan AI generatif ke tempat kerja sambil mematuhi persyaratan izin dan manajemen data yang ketat di perusahaan. Saat ini, salah satu kendala utama yang menghalangi perusahaan untuk menerapkan aplikasi AI ke dalam produksi adalah ketidakmampuan mereka untuk menerapkan kontrol tata kelola yang tepat. Dengan memasukkan izin data real-time ke dalam lingkungan lokal perusahaan, Glean telah menjadi solusi ideal untuk membantu perusahaan memecahkan masalah tata kelola dalam skala besar dan memungkinkan perusahaan dengan percaya diri memanfaatkan data internal mereka untuk pelatihan model dan inferensi, sehingga memanfaatkan tingkat perusahaan. Platform data AI /Peran penyimpanan vektor.
Seiring berjalannya waktu, kami yakin setiap perusahaan akan memiliki versi AI-nya sendiri yang memahami nuansa bisnis dan karyawannya. Kami yakin Glean memanfaatkan peluang ini.
—Josh Coyne, Mitra, Kleiner Perkins
3. Tombak
Penyimpanan dan Pengelolaan Data Multimoda
Kita semua pernah memainkan Midjourney, dan sebagian besar dari kita pernah melihat demo GPT-4. Midjourney (teks ke gambar) dan GPT-4 (gambar ke teks/kode) menggambarkan kemungkinan ketika model menjadi multimodal, menjembatani berbagai bentuk media seperti teks, gambar, dan audio. Meskipun sebagian besar kegemaran AI saat ini berkisar pada model berbasis teks, model multimodal adalah kunci untuk membangun representasi dunia yang lebih akurat.
Saat kita memulai gelombang penerapan AI berikutnya di industri seperti robotika, layanan kesehatan, manufaktur, hiburan, dan periklanan, semakin banyak perusahaan yang akan membangun model multimoda. Perusahaan seperti Runway dan Flair.ai adalah contoh yang baik dari pemimpin baru di bidangnya yang telah melihat besarnya permintaan pengguna terhadap produk mereka, sementara perusahaan yang sudah ada seperti Google telah mulai meluncurkan kemampuan multimoda serupa.
Namun, penggunaan model multimodal menimbulkan tantangan: bagaimana cara menyimpan dan mengelola data? Format penyimpanan tradisional seperti Parket tidak dioptimalkan untuk data tidak terstruktur, sehingga tim model bahasa yang besar mengalami kinerja yang lambat saat memuat, menganalisis, mengevaluasi, dan melakukan debug data. Selain itu, alur kerja model bahasa yang besar lebih rentan terhadap kesalahan halus karena kurangnya satu sumber kebenaran. Lance adalah perusahaan terbaru yang muncul untuk mengatasi tantangan ini. Perusahaan seperti Midjourney dan WeRide mengonversi kumpulan data berskala petabyte ke dalam format Lance, yang memberikan peningkatan kinerja yang signifikan dan biaya penyimpanan tambahan yang jauh lebih rendah dibandingkan dengan format tradisional seperti Parket dan TFRecords.
Lance tidak berhenti pada penyimpanan, mereka menyadari perlunya membangun kembali seluruh tumpukan manajemen data mereka agar lebih selaras dengan dunia yang kita tuju, di mana data multimodal yang tidak terstruktur akan menjadi aset perusahaan yang paling berharga. Produk platform pertama mereka, LanceDB (saat ini dalam versi beta pribadi), memberikan pengalaman tertanam yang lancar bagi pengembang yang ingin membangun fungsionalitas multimodal ke dalam aplikasi mereka.
Lance hanyalah salah satu contoh bagaimana perusahaan membawa pengembang ke masa depan multimodal, dan saya sangat bersemangat melihat teknologi lain muncul untuk memajukan aplikasi multimodal. Dengan berkembangnya kecerdasan buatan, tidak lama lagi masa depan seperti itu akan menjadi kenyataan.
——Saar Gur, Mitra Umum, CRV
4. Keamanan Tidak Normal
Menahan gelombang serangan siber yang didukung AI
Saya seorang optimis yang tidak tahu malu dalam hal AI generatif, tetapi saya tidak naif dalam hal ini. Misalnya, saya khawatir dengan maraknya serangan "rekayasa sosial" seperti spear phishing, yang sering kali menggunakan email untuk mengekstrak informasi sensitif. Sejak ChatGPT menjadi populer tahun lalu, kejadian serangan semacam ini telah meningkat secara dramatis.
Pada tahun lalu, jumlah serangan per 1.000 orang telah melonjak dari kurang dari 500 menjadi lebih dari 2.500, menurut Abnormal Security. Kecanggihan serangan juga meningkat secara dramatis. Sama seperti siswa mana pun yang dapat menggunakan ChatGPT untuk menulis esai yang sempurna, ChatGPT juga dapat digunakan untuk mengirim pesan penipuan yang tata bahasanya sempurna dan dipersonalisasi secara berbahaya.
Menurut FBI, serangan "kompromi email bisnis" yang ditargetkan seperti itu telah menyebabkan kerugian lebih dari $50 miliar sejak tahun 2013. Dan itu akan menjadi lebih buruk. Setiap hari, banyak sekali penjahat dunia maya dan pelaku kejahatan lainnya yang mengeksploitasi alat topi hitam seperti “WormGPT,” sebuah chatbot yang dirancang untuk menambang data malware guna mengatur kampanye penipuan yang paling meyakinkan dan berskala besar untuk melakukan aktivitas penipuan.
Untungnya, salah satu pendiri Abnormal, Evan Reiser dan Sanjay Jeyakumar, bekerja keras menggunakan kecerdasan buatan untuk memerangi ancaman ini. Anda dapat menganggap ini sebagai penggunaan AI untuk melawan AI. Secara historis, sistem keamanan email memindai tanda tangan dari perilaku buruk yang diketahui, seperti alamat IP tertentu atau upaya mengakses informasi pengenal pribadi (PII).
Memanfaatkan kekuatan kecerdasan buatan, Abnormal merongrong semua ini. Karena banyak serangan tampak sah berkat kecerdasan buatan, pendekatan Abnormal adalah memahami sepenuhnya perilaku baik yang diketahui sehingga penyimpangan halus pun dapat diketahui. Perusahaan ini menggunakan model bahasa skala besar untuk membangun representasi rinci tentang cara kerja digital internal dan eksternal, seperti siapa yang biasanya berbicara satu sama lain dan konten apa yang cenderung berinteraksi dengan mereka. Jika rekan saya Reid Hoffman mengirimi saya email dan berkata, "Hei, tolong kirimkan saya informasi terbaru tentang Inflection.AI." Mesin AI Abnormal akan segera mengetahuinya. , Reed jarang memulai dengan "hei", jarang mengirimkan satu kalimat pun, dan dia tidak pernah meminta saya untuk mengiriminya file tentang Infleksi.AI. (Sebagai salah satu pendiri dan anggota dewan perusahaan, dia memiliki lebih banyak akses terhadap dokumen-dokumen ini dibandingkan saya!).
Tidak mengherankan, seiring dengan meningkatnya kekhawatiran keamanan seputar AI generatif, permintaan pelanggan korporat Abnormal pun meningkat. Saya rasa kesuksesan Abnormal sangat menggembirakan karena mampu memanfaatkan AI dengan begitu cepat untuk mengatasi permasalahan yang sedang dipercepat oleh AI. Dalam periode perubahan teknologi yang disruptif, pelaku kejahatan sering kali menikmati keuntungan jangka panjang. Bagaimanapun, mereka dapat memanfaatkan inovasi tanpa harus mengkhawatirkan kualitas produk, keamanan, atau regulator yang belum membuat undang-undang baru.
Pada saat yang sama, dapat dipahami bahwa startup teknologi berfokus pada pengembangan kasus penggunaan baru yang kuat untuk inovasi mereka dibandingkan memblokir inovasi ilegal atau disruptif. Namun seperti semua masalah yang berkaitan dengan kecerdasan buatan, kerusakan dunia maya yang disebabkan oleh penyalahgunaan kecerdasan buatan sangatlah mengejutkan. Berkat pandangan ke depan dari tim Abnormal, kemungkinan terjadinya kejahatan dunia maya yang baru (new normal) mungkin akan berkurang.
—Sam Motamedi, Mitra, Greylock
5. Debu
Berdayakan pekerja berpengetahuan
Jelas bahwa model bahasa yang besar akan meningkatkan efisiensi pekerja pengetahuan. Namun tidak jelas bagaimana hal itu akan dilakukan. Dust sedang mencoba mencari tahu. Manajer pengetahuan tidak akan banyak membantu dalam perusahaan jika mereka tidak dapat mengakses data internal. Jadi Dust membangun platform yang mengindeks, menyematkan, dan memperbarui data internal perusahaan secara real-time (Notion, Slack, Drive, GitHub) dan memaparkannya ke produk yang didukung oleh model bahasa besar.
Salah satu pendiri Dust, Gabriel Hubert dan Stanislas Polu, menjual perusahaannya ke Stripe dan bekerja di sana selama lima tahun. Mereka telah melihat secara langsung bagaimana perusahaan-perusahaan yang berkembang pesat berjuang melawan skala. Mereka telah melihat secara langsung apa yang disebut "utang informasi", dan kini mereka berfokus pada penerapan model bahasa besar untuk memecahkan beberapa permasalahan utama yang terkait dengannya. Saat ini, Dust sedang menjajaki aplikasi berikut pada platformnya:
Mesin penjawab. Penekanannya adalah pada faktualitas karena hal ini merupakan kunci untuk diadopsi secara luas.
Hasilkan asisten. Memberikan bantuan template saat membuat konten. Misalnya, menghasilkan paragraf yang hilang berdasarkan data internal.
*Dokumen diperbarui secara otomatis. Setiap kali muncul informasi dalam perusahaan yang harus memperbarui dokumen, pemilik dokumen menerima pemberitahuan dan saran.
Ekstraksi acara terstruktur. Pengguna dapat membuat peristiwa terstruktur dari data tidak terstruktur (seperti rangkaian Slack) berdasarkan templat yang telah ditentukan sebelumnya.
Pemantauan data internal. Pantau data perusahaan dengan aturan cerdas. Misalnya, dapatkan peringatan jika informasi identitas pribadi (PII) secara tidak sengaja muncul di tempat yang tidak seharusnya.
Meskipun kontennya banyak, para pendiri Dust percaya bahwa sebagian besar aliran data ini pada akhirnya akan menyatu menjadi satu produk terpadu. Mereka masih dalam tahap awal eksplorasi dan membentuk gambaran akhir tentang Debu. Berdasarkan pengulangan awal, mereka yakin bahwa mereka telah mengkonfirmasi hipotesis inti mereka: bahwa kemampuan pekerja pengetahuan dapat ditingkatkan (bukan digantikan) dengan model bahasa yang besar, dan bahwa 'sistem operasi tim' baru dapat dibangun berdasarkan hal ini.
——Konstantine Buhler, mitra di Sequoia Capital
6. Kotak Label
Rilis data bisnis
“Kebangkitan big data” telah berlangsung selama lebih dari 20 tahun, dan meskipun perusahaan terus menyerap lebih banyak data dibandingkan sebelumnya, banyak perusahaan masih kesulitan menggunakan data ini untuk mendapatkan wawasan dari model kecerdasan buatan. Pemrosesan dan interpretasi data tetap menjadi bagian proses AI yang paling membosankan dan mahal, tetapi juga yang paling penting untuk hasil berkualitas tinggi. Bahkan dengan peningkatan model bahasa besar yang telah dilatih sebelumnya, perusahaan masih perlu fokus pada penggunaan data milik mereka sendiri (di berbagai modalitas) untuk menciptakan AI generatif yang diposisikan secara unik untuk memberikan layanan dan wawasan yang berbeda, dan meningkatkan efisiensi operasional.
Labelbox memecahkan tantangan ini dengan menyederhanakan cara bisnis memasukkan kumpulan data ke dalam model AI. Ini membantu tim data dan pembelajaran mesin menemukan data yang tepat, memproses dan menafsirkannya, memasukkan model ke aplikasi, dan terus mengukur dan meningkatkan kinerja.
Platform baru Labelbox memanfaatkan kecerdasan buatan generatif. Model Foundry memungkinkan tim bereksperimen dengan cepat dengan model dasar AI dari semua penyedia sumber tertutup dan terbuka, memungkinkan mereka melakukan pra-pelabelan data dan bereksperimen dengan cepat hanya dengan beberapa klik. Dengan cara ini, mereka dapat memahami model mana yang memiliki performa terbaik pada datanya. Model Foundry secara otomatis menghasilkan metrik kinerja terperinci untuk setiap eksperimen yang dijalankan sambil membuat versi hasilnya.
Dampaknya bisa sangat luas. Secara tradisional, manusia menghabiskan waktu berhari-hari untuk menyelesaikan tugas sederhana namun memakan waktu, seperti mengklasifikasikan daftar e-commerce yang berisi beberapa paragraf teks. Dengan GPT-4, tugas ini dapat diselesaikan dalam beberapa jam. Model Foundry memungkinkan perusahaan menemukan sendiri cara-cara efisien ini.
Ini bukan satu-satunya contoh. Hasil awal menunjukkan bahwa lebih dari 88% tugas pelabelan dapat dipercepat dengan satu atau lebih model dasar. Labelbox memungkinkan siapa saja untuk memberi label awal pada data hanya dengan beberapa klik, tanpa perlu mengkode dan memasukkan data ke dalam model. Alat ini dirancang untuk memberdayakan tim untuk bekerja secara kolaboratif dan memanfaatkan keahlian lintas fungsi untuk mempertahankan pengawasan manual terhadap penjaminan kualitas data. Kemampuan ini mendemokratisasi akses terhadap kecerdasan buatan dengan memungkinkan para ahli model bahasa dan perusahaan kecil dan menengah mengevaluasi model dengan mudah, memperkaya kumpulan data, dan berkolaborasi untuk membangun aplikasi cerdas.
Labelbox terbukti secara signifikan mengurangi biaya dan meningkatkan kualitas model untuk perusahaan terbesar di dunia, termasuk Walmart, Procter & Gamble, Genentech, dan Adobe.
Saat ini terdapat kompetisi bagi perusahaan untuk memanfaatkan kekuatan model dasar ini pada data milik mereka untuk memecahkan masalah bisnis. Kami berharap dapat melihat bagaimana Labelbox akan membantu bisnis membuka kunci data untuk menghasilkan produk yang lebih baik dengan efisiensi yang lebih besar.
——Robert Kaplan, Mitra, SoftBank
7. Landasan pacu
Suite Kreatif Baru
Kecerdasan buatan ada dimana-mana dan semakin menjadi sebuah komoditas. Dalam kebanyakan kasus, perusahaan menggunakan AI sebagai chatbots untuk memperkaya aplikasi yang sudah ada. Hanya sedikit aplikasi AI yang menciptakan kembali pengalaman produk, menggunakan teknologi ini untuk mengubah secara mendasar cara kita berinteraksi dengan produk, seperti mesin pencari Google yang mengubah cara kita menjelajah internet, atau Instagram mengubah cara kita berbagi foto dari ponsel. Dengan cara yang sama. Penerapan AI ini memerlukan pemahaman mendalam tentang pengalaman pengguna yang ada, pemikiran produk yang visioner, dan teknologi mutakhir.
Runway adalah contoh utama perusahaan yang menggunakan penelitian AI terapan untuk menata ulang pengalaman kreatif dan membangun rangkaian materi iklan yang benar-benar baru.
Pemahaman mendalam tentang pengalaman pengguna. Pendiri Cristobal Valenzuela, Anastasis Germanidis dan Alejandro Matamara-Ortiz Alejandro Matamala-Ortiz adalah peneliti jurusan telekomunikasi interaktif di New York University dan memiliki pengalaman desain selama bertahun-tahun. Tim di Runway memahami ekosistem alat kreatif dari pengalaman langsung dan hambatan dalam adopsi massal. Misalnya, produksi film kreatif seringkali memerlukan mesin yang mahal, sumber daya perangkat lunak, dan pelatihan tingkat tinggi. Akibatnya, pembuatan film kreatif secara historis terkonsentrasi di studio-studio besar. Runway melihat peluang untuk memperluas dan meningkatkan aksesibilitas alat kreatif yang dibutuhkan.
Pemikiran produk yang berpandangan jauh ke depan. Runway menyadari sejak awal bahwa titik perubahan dalam kecerdasan buatan dapat meningkatkan pengalaman pengguna secara dramatis, tidak hanya menyempurnakan alat kreatif yang ada tetapi juga secara mendasar mengubah cara kerja alat tersebut. Misalnya, pengguna dapat membuat konten video yang benar-benar baru dari awal menggunakan perintah teks sederhana. Yang penting, video ini berkelas profesional dan dapat dibagikan melalui desktop atau perangkat seluler. Terlepas dari tingkat keahlian, latar belakang, atau sumber daya, Runway dapat menghemat waktu berjam-jam atau berhari-hari dalam pekerjaan pengeditan. Ini adalah produk visioner yang mengubah pengingat sederhana menjadi kehidupan yang hidup dan menyentuh.
Pakar teknologi kecerdasan buatan terkemuka. Runway tidak hanya memecahkan masalah dengan produk visioner, tetapi juga menata ulang infrastruktur penelitian dan teknologi yang mendasarinya. Organisasi penelitian internal Runway memimpin dalam jaringan saraf dalam untuk sintesis gambar dan video. Perusahaan telah mengembangkan Gen-2, model video kecerdasan buatan multi-modal yang lebih kuat dari apa pun yang ada di pasaran saat ini. Ini adalah model publik pertama yang mampu mengubah teks menjadi video. Sebelumnya, Runway merilis Gen-1, sebuah model yang mengarah pada perubahan paradigma dalam alat pembuatan video yang menghasilkan keluaran berkualitas tinggi. Peneliti runway juga memelopori model Difusi Stabil teks-ke-gambar.
Sejak Oktober 2022, Runway telah mengembangkan lebih dari 30 "alat ajaib" AI yang mencakup video, gambar, 3D, dan teks, melayani seluruh aspek proses kreatif, mulai dari praproduksi hingga pascaproduksi. Basis klien mereka mencakup perusahaan Fortune 500 dan Global 2000 seperti The Late Show with Stephen Colbert dari CBS, New Balance, Harbour Picture Video, Publicis) dan Google. Platform ini juga telah digunakan untuk mengedit film-film nominasi Oscar seperti film hit Hollywood Everything Everywhere All at Once.
Aplikasi AI yang paling menarik mengubah pengalaman produk yang ada dan memikirkan kembali cara pengguna berinteraksi dengan produk. Dengan Runway, pengguna dapat menyelesaikan kreasi video baru dalam hitungan detik, baik saat pertama kali merekam video atau berada di studio secara profesional. Ini adalah perubahan revolusioner dan contoh bagaimana kecerdasan buatan mengubah berbagai industri.
—Grace Isford, mitra di Lux Capital
8. Batas Baru
Membentuk kembali nasib sel
Sel adalah sistem komputer paling kompleks di dunia. Seperti chip komputer, DNA terdiri dari unit-unit dasar yang menciptakan fungsi-fungsi kompleks. Berbeda dengan kode berbasis bit, kode berbasis atom bersifat acak dan hierarkis. Satu sistem bergantung pada sistem lain, yang pada gilirannya bergantung pada sistem fisik lainnya, yang masing-masing dipengaruhi oleh panas, keasaman, dan molekul dalam lingkungan mikro sel.
Terlepas dari saling ketergantungan ini, kode mesin seluler (DNA) dapat menjalankan berbagai program secara efisien. Meskipun sel hati dan sel kulit Anda mengandung genom yang sama, jenis sel ini terlihat, terasa, dan berfungsi secara berbeda. Mengapa? Karena mereka menjalankan program epigenetik yang berbeda.
Pada tahun 2006, Takahashi dkk menggunakan kombinasi empat protein faktor transkripsi (TF) untuk memprogram ulang sel dewasa menjadi sel induk, yang memelopori bidang pemrograman ulang epigenetik. Faktor transkripsi adalah protein yang mengatur gen, pada dasarnya mengubah “program” yang sedang berjalan. Penemuan Takahashi dan Yamanaka mengarah pada penciptaan sel induk berpotensi majemuk terinduksi (iPSCs) dan memenangkan Hadiah Nobel. Sejak itu, banyak kelompok penelitian mulai menerapkan kombinasi TF unik untuk mengubah keadaan sel, meremajakan sel yang rusak, dan memulihkan fenotip sel muda.
Meskipun pemrograman ulang epigenetik menjadi lebih mudah dilakukan, hal ini tetap bukan masalah sepele. Tim harus membedakan kombinasi TF mana yang efektif dalam transisi sel dari keadaan A ke keadaan B yang diinginkan. Misalnya, kombinasi TF di masa depan memungkinkan kita mengubah sel yang sakit menjadi sel sehat, sehingga mengembangkan kelas obat baru. Kita memerlukan layar pemrograman ulang berskala sangat besar karena kombinasi TF yang tepat tidak diketahui di banyak area aplikasi. Terdapat lebih dari 1.500 TF manusia asli, sehingga diperlukan metode pencarian yang lebih efisien. Kami yakin NewLimit sedang merancang pendekatan seperti itu.
Didukung oleh kemajuan dalam teknologi pengurutan sel tunggal dan pembelajaran mesin, NewLimit mengubah disiplin yang sebelumnya manual menjadi sains berbasis data. Perusahaan ini memiliki pembagian kerja yang sehat antara ahli biologi molekuler dan ahli biologi komputasi, sehingga meletakkan dasar budaya yang diperlukan untuk membangun platform loop tertutup yang semakin efisien. Menggabungkan keahlian dan pembacaan multimodal (scRNA-Seq, scATAC-Seq, dll.), NewLimit bertujuan untuk menemukan remodeler terapeutik untuk mengobati penyakit yang sebelumnya sulit disembuhkan.
Dalam setiap putaran eksperimen, NewLimit menggunakan teknologi bahasa mesin untuk:
Gabungkan dan kompres beberapa pembacaan deteksi ke dalam ruang pengoptimalan berdimensi rendah yang berisi status A saat ini dan status B sel yang diinginkan.
Hitung kombinasi TF baru di sepanjang ruang pengoptimalan yang dapat mendorong unit ke kondisi yang diinginkan.
Merekomendasikan jenis data apa yang akan membantu meningkatkan model dan kapan/di mana menerapkan metode eksperimental yang lebih mahal dan throughput yang lebih rendah.
Menyarankan perubahan yang harus dilakukan pada platform untuk memaksimalkan informasi berguna yang dihasilkan untuk setiap dolar yang dibelanjakan.
Selain timnya yang luar biasa, kecakapan teknis, dan visi ambisiusnya, kami juga mengagumi semangat pragmatis NewLimit. Meskipun perusahaan belum mengumumkan rincian strategi bisnis awalnya kepada publik, kami yakin pendekatan ini kreatif, mengurangi risiko secara wajar, dan berpotensi membawa perubahan bagi umat manusia. Tim pendiri setuju bahwa platform bioteknologi dapat disamakan dengan proyek ilmiah yang mahal tanpa menghasilkan aset jangka pendek. Untuk mencapai tujuan ini, NewLimit telah transparan dan membuat katalog kemajuan teknologinya sejak awal.
Kita harus merasa rendah hati dengan kompleksitas alam. Yang pasti, biologi lebih sulit diprogram dibandingkan perangkat silikon yang kita rancang sendiri. Tujuan Dimension adalah memberdayakan pionir wirausaha seperti NewLimit untuk mengeksplorasi batas-batas kemungkinan dalam antarmuka teknologi dan biologi.
—Simon Barnett, Direktur Riset, Dimension
9. Tepi kolam renang
Kecerdasan Buatan Dasar untuk Pengembangan Perangkat Lunak
OpenAI berfokus pada kecerdasan buatan secara umum, DeepMind berfokus pada penemuan ilmiah, dan kasus penggunaan mendasar ketiga dari kecerdasan buatan adalah memahami dan membuat perangkat lunak.
GPT-4 sudah tertanam dalam alur kerja pengembang berpengalaman dan pemula. Namun perubahan paradigma ini masih dalam tahap awal. Mengekstrapolasi dari beberapa bulan terakhir, pemrograman yang dibantu AI akan segera tersebar luas. Ketika tren ini berkembang lebih jauh, bahasa alami akan menjadi landasan abstrak di mana perangkat lunak dibangun.
Meskipun perusahaan lain telah merilis model kode murni berskala besar seperti StarCoder, belum ada metode yang mampu menandingi performa GPT-4. Saya rasa ini karena model yang dilatih hanya pada kode tidak dapat menghasilkan kemampuan pengembangan perangkat lunak yang kuat. Begitulah cara saya bertemu Poolside. Perusahaan ini didirikan oleh Jason Warner, mantan chief technology officer GitHub, dan Eiso Kant, mantan pendiri source{d}, perusahaan kecerdasan buatan kode penelitian pertama di dunia.
Poolside unik karena menggunakan pendekatan model dasar OpenAI tetapi hanya fokus pada satu fungsi: pembuatan kode. Strategi teknologi mereka bergantung pada fakta bahwa kode dapat dieksekusi, memungkinkan adanya umpan balik langsung dan otomatis selama proses pembelajaran. Hal ini memungkinkan pembelajaran penguatan melalui eksekusi kode, sebuah alternatif menarik untuk pembelajaran penguatan berdasarkan umpan balik manusia (RLHF). Ini adalah sesuatu yang mulai dieksplorasi Esso sejak tahun 2017.
Meskipun potensi kecerdasan umum buatan (AGI) untuk memberikan manfaat bagi umat manusia tidak dapat disangkal, namun realisasinya masih jauh. Jadi mengapa menunggu AGI? Dengan berfokus pada bidang tertentu dalam memajukan AI, seperti pengembangan perangkat lunak, kita dapat menghilangkan lebih banyak hambatan terhadap kreativitas. Saya menantikan hari ketika tim Poolside mewujudkan visinya dalam membangun model infrastruktur perangkat lunak khusus.
——Matan Grinberg, salah satu pendiri dan CEO Pabrik
10. Mistral
Pesaing OpenAI di Prancis
Baru-baru ini, Paris disinari oleh ledakan proyek di bidang kecerdasan buatan generatif. Mungkin Anda akan bertanya kenapa? Menurut saya, Paris memiliki kumpulan talenta kelas dunia terbesar di bidang AI generatif yang berada di luar cakrawala peristiwa OpenAI. Dari proyek-proyek ini, yang paling berani tidak diragukan lagi adalah Mistral. Mistral didirikan oleh Guillaume Lample, Arthur Mensch dan Timothe Lacroix dengan misi untuk membangun model bahasa sumber terbuka terbaik. Tujuannya adalah untuk membangun ekosistem yang berkembang di sekitar model ini.
Saya telah mengenal Guillaume selama empat tahun, dan kami berdua sangat terlibat dalam penerapan model bahasa besar pada bidang matematika, khususnya matematika formal. Saat bekerja di OpenAI dan Meta, kami mengembangkan hubungan kompetitif yang bersahabat. Guillaume adalah salah satu peneliti paling berbakat yang pernah saya ajak bekerja sama, dan saya mendapat kehormatan melihatnya beralih dari penelitian di Meta hingga mendirikan Mistral. Dalam prosesnya, saya juga bertemu Arthur Mensch. Saya selalu terkesan dengan karyanya, terutama Chinchilla, yang mendefinisikan ulang apa artinya melatih model bahasa besar secara efisien, dan RETRO, sebuah pendekatan untuk pemodelan bahasa yang disempurnakan dengan pengambilan yang, menurut saya, masih belum sepenuhnya dieksplorasi.
Sekarang, mari kita gali apa yang membuat Mistral Mistral. Visi startup ini adalah membangun ekosistem berdasarkan model open source terbaik di kelasnya. Ekosistem ini akan berfungsi sebagai landasan peluncuran proyek, tim, dan perusahaan, mempercepat laju inovasi dan penggunaan kreatif model bahasa besar.
Ambil contoh pembelajaran penguatan berdasarkan umpan balik manusia (RLHF). Biasanya, melakukan RLHF memakan waktu dan oleh karena itu mahal. Ini melibatkan "penandaan" tindakan AI secara manual, yang mungkin memerlukan banyak pekerjaan. Upaya ini hanya akan bermanfaat jika potensi model AI cukup baik. Bagi perusahaan besar seperti OpenAI, berinvestasi dalam proses ini adalah hal yang masuk akal, dan perusahaan memiliki sumber daya untuk mewujudkannya. Namun komunitas open source tradisional biasanya membutuhkan "pemimpin" untuk melangkah maju dan memikul tanggung jawab penting ini.
Mistral mempunyai peluang untuk melakukan hal tersebut, dengan berinvestasi pada model open source untuk RLHF. Dengan melakukan hal ini, Mistral akan membuka pintu bagi ledakan inovasi pada masa Kambrium. Pengembang sumber terbuka akan memiliki akses ke model berlabel jelas yang dapat mereka adaptasi dan sesuaikan untuk berbagai kebutuhan. Pemenang utamanya adalah pasar yang lebih luas, dan kita akan memiliki akses terhadap kasus penggunaan yang lebih spesifik dan menarik dibandingkan yang dapat dihasilkan oleh satu perusahaan tertutup saja.
Siapa pun yang memiliki model open source terbaik akan menarik lebih banyak minat dan nilai. Saya optimistis pada Mistral karena tim secara aktif mendorong batas efisiensi/kinerja. Pada saat yang sama, bakat Mistral di bidang ini adalah yang terbaik di dunia.
Mistral telah mengamankan tim dan sumber daya untuk melaksanakan visi awal ini. Perusahaan juga telah menemukan mitra untuk mengevaluasi model ini dalam kasus penggunaan tingkat perusahaan. Awasi Mistral, mereka siap menghadapi OpenAI.
——Stanislas Polu, salah satu pendiri Dust
11. Bereaksi
Robot Industri yang Lebih Cerdas
Kita sering mendengar prediksi bahwa dalam jangka panjang, kecerdasan buatan dan robotika akan menambah atau mengotomatiskan tugas-tugas manusia. Saat ini, hal ini semakin menjadi keharusan bisnis yang mendesak.
Pada tahun 2030, populasi usia kerja di Eropa diperkirakan akan berkurang sebesar 13,5 juta, dan biaya tenaga kerja meningkat pada tingkat tercepat dalam lebih dari 20 tahun. Dengan maraknya e-commerce, gudang berada di bawah tekanan yang lebih besar dan tantangan bagi bisnis untuk tetap kompetitif menjadi semakin besar.
55% biaya operasional gudang berasal dari pengambilan pesanan, namun situasinya tidak optimis bagi perusahaan yang ingin beralih ke sistem otomatis. Tak satu pun dari aplikasi mencolok yang kita kenal di SaaS (perangkat lunak sebagai layanan) yang dipimpin AI, atau sejumlah besar produk sumber terbuka yang kita lihat di bagian lain ekosistem, belum diterapkan pada robotika.
Sebaliknya, bisnis yang ingin mengotomatisasi pengambilan dan pengepakan dihadapkan pada pilihan solusi robotik yang mahal dan tidak fleksibel. Mereka harus menavigasi sejumlah antarmuka berpemilik yang memerlukan waktu dan keahlian pemrograman yang signifikan. Sistem ini juga kesulitan menghadapi perubahan bauran produk, memerlukan intervensi manusia secara rutin, dan berkinerja buruk saat menangani situasi ekstrem.
Rahasia memecahkan masalah ini. Perangkat lunaknya didasarkan pada lingkungan simulasi yang kuat yang melatih lengan robot untuk memahami nuansa spasial dan fisik dari setiap potensi lingkungan dunia nyata. Setelah diterapkan, sistem akan dioptimalkan dengan terus belajar dari data dunia nyata. Hal ini juga berarti mereka dapat mengatasi tantangan dalam mengambil barang-barang yang biasanya sulit didapat seperti barang elektronik, tekstil, buah-buahan, ubin dan kayu.
Yang paling menarik, tumpukan robotika mereka menggunakan model bahasa besar untuk memungkinkan kontrol bahasa alami robot yang intuitif. Mereka mengembangkan model konverter yang disebut "PickGPT" yang memungkinkan pengguna memberikan instruksi dan umpan balik kepada robot melalui suara atau teks. Dengan cara ini, siapa pun dapat meminta robot untuk melakukan tugas yang diinginkan, terlepas dari tingkat pengetahuan teknisnya.
Secret menggabungkan dua bidang keahlian para pendirinya. CEO Ralf Gulde telah bekerja di persimpangan antara kecerdasan buatan dan robotika, sementara CTO Marc Tusher berspesialisasi dalam pembelajaran mendalam. Pasangan ini melakukan penelitian peer-review pada mata pelajaran ini di Universitas Stuttgart, salah satu universitas paling bergengsi di Jerman untuk otomasi dan manufaktur industri.
Meskipun merupakan perusahaan muda, Sereact telah menarik banyak mitra, termasuk Daimler Truck, Schmalz, Zenfulfillment, Zimmer Group ) dan Material Bank. Hal ini menunjukkan bahwa terdapat potensi peluang pasar yang sangat besar di industri pengambilan dan pengepakan.
Di luar kasus penggunaan yang jelas di gudang e-commerce, baik pengambilan pesanan atau pembongkaran kotak, terdapat sejumlah kasus penggunaan lainnya. Misalnya, dalam manufaktur tradisional, ada proses yang memakan waktu yang disebut perakitan, yang melibatkan pengumpulan bagian-bagian halus yang diperlukan untuk perakitan dengan susah payah. Lengan robot secara historis kesulitan untuk menangkap bagian-bagian kecil dan memilah bagian-bagian individual di lingkungan yang berantakan. Perangkat lunak Sereact dapat mengidentifikasi bagian-bagian ini dan memilih gripper yang tepat untuk memilihnya.
Tim Sereact tidak hanya berketerampilan tinggi, namun juga memiliki pemahaman mendalam tentang lingkungan kerja klien dan keinginan tulus untuk membantu klien mengatasi kekurangan tenaga kerja dan mencapai operasi yang efisien dan berkelanjutan. Sebagai perusahaan pertama yang mengubah kombinasi model bahasa besar dan kemasan pikap dari kemungkinan akademis menjadi dampak nyata, saya memiliki keyakinan penuh pada kemampuan mereka untuk mengeksekusi dan meningkatkan skala robotika yang sesungguhnya.
—Nathan Benaich, mitra umum di Air Street Capital
12. Lamini
Mesin model bahasa skala besar yang dibuat khusus
Kini, setiap perusahaan berusaha mengintegrasikan kecerdasan buatan ke dalam bisnis perusahaannya. Perusahaan-perusahaan terbesar di dunia menyadari potensi kecerdasan buatan, dengan 20% CEO di S&P 500 menyebutkan AI dalam laporan pendapatan kuartal pertama mereka. Model bahasa besar dapat meningkatkan efisiensi bisnis secara signifikan dengan mempercepat fungsi inti seperti dukungan pelanggan, penjualan keluar, dan pengkodean. Model bahasa besar juga dapat meningkatkan pengalaman produk inti dengan menjawab pertanyaan pelanggan menggunakan asisten berbasis AI, atau menciptakan alur kerja AI generatif baru untuk menyenangkan pelanggan.
Mengingat perusahaan besar cenderung lambat dalam mengadopsi teknologi baru, kami terkejut melihat betapa cepatnya perusahaan mulai membangun dengan AI. Tidak mengherankan jika banyak perusahaan ingin membangun model dan solusi AI mereka sendiri. Setiap bisnis memiliki kumpulan data pelanggan, sering kali sebagai bagian dari parit bisnis intinya. Perusahaan-perusahaan ini melihat adanya risiko dalam mengirimkan data mereka yang paling berharga ke API model dasar atau startup yang keandalannya tidak pasti. Meskipun ada masalah privasi data, model bahasa publik berskala besar seperti GPT-4 atau Claude dilatih sepenuhnya pada data terbuka sehingga tidak memiliki kemampuan penyesuaian untuk kasus penggunaan khusus perusahaan dan segmen pelanggan.
Beberapa perusahaan teknologi, seperti Shopify dan Canva, telah membentuk "Tim Harimau AI" internal untuk menggunakan model sumber terbuka siap pakai guna mengintegrasikan kecerdasan buatan ke seluruh bagian bisnis. Namun, sebagian besar perusahaan tidak memiliki sumber daya atau peneliti AI berpengalaman untuk membangun dan menerapkan model bahasa berskala besar berdasarkan data mereka sendiri. Mereka menyadari bahwa gelombang AI ini dapat menjadi momen transformasional bagi masa depan bisnis mereka, namun sejauh ini mereka belum mampu memanfaatkan atau mengendalikan pengembangan AI mereka sendiri.
Itu sebabnya kami sangat gembira dengan apa yang dilakukan Sharon Zhou dan Greg Diamos serta tim mereka di Lamini. Lamini adalah mesin model bahasa berskala besar yang memudahkan pengembang untuk melatih, menyempurnakan, menerapkan, dan meningkatkan model mereka sendiri dengan cepat menggunakan masukan manusia. Alat ini memberikan pengalaman pengembangan yang menyenangkan yang menghilangkan kompleksitas model AI dan, yang lebih penting, memungkinkan perusahaan membangun solusi AI berdasarkan data mereka sendiri tanpa harus mempekerjakan peneliti AI atau berisiko mengalami kebocoran data. Kami bekerja dengan Sharon dan Greg untuk pertama kalinya pada musim gugur lalu. Sejak saat itu, kami mempunyai kesempatan untuk mendukung tim pendiri yang ahli secara teknis dan berfokus pada pelanggan ini seiring mereka mewujudkan visi ambisius mereka untuk mengubah cara bisnis mengadopsi AI.
Secara khusus, penerapan model bahasa besar privat dengan Lamini menawarkan berbagai keuntungan dibandingkan menggunakan solusi publik. Memiliki tim teknik internal yang menangani proses pembangunan akan memastikan privasi data dan memungkinkan fleksibilitas yang lebih besar dalam pemilihan model serta seluruh komputasi dan tumpukan data. Model yang dibuat menggunakan Lamini juga mengurangi artefak, mengurangi latensi, memastikan runtime yang andal, dan biaya lebih rendah dibandingkan dengan API yang tersedia. Peningkatan kinerja ini berasal dari wawasan teknis inti yang dibangun oleh tim Lamini ke dalam produk berdasarkan penelitian selama puluhan tahun dan pengalaman industri seputar model AI dan optimalisasi GPU.
Startup terkenal dan perusahaan besar telah menggunakan Lamini untuk menerapkan model bahasa besar secara internal dan dengan pelanggan, dan mereka sangat antusias dengan kecepatan pengaturan, kinerja, dan keandalannya. Di masa depan, kami percaya bahwa setiap perusahaan akan menggunakan AI dalam bisnis dan produknya, namun hanya sedikit perusahaan yang memiliki tim AI khusus. Lamini adalah startup yang menyamakan kedudukan dan memberikan kesempatan kepada semua perusahaan untuk memanfaatkan teknologi transformatif ini. Berkat kemitraan baru-baru ini dengan Databricks, kini semakin mudah bagi perusahaan untuk menyiapkan dan menjalankan solusi AI mereka dengan menyiapkan Lamini langsung di data lake dan cluster komputasi Databricks yang ada.
——James Wu, investor Modal Putaran Pertama; Todd Jackson, mitra Modal Putaran Pertama
13. Pabrik
"Robot" Pengkodean Anda
Saat ini, jika Anda ingin komputer melakukan sesuatu untuk Anda, Anda harus menerjemahkan pemikiran Anda ke dalam "bahasa komputer", sebuah kode hypertext yang dapat dipahami oleh kompiler. Untuk menjadi seorang insinyur, Anda harus memutar otak Anda seperti mesin. Namun, kita mencapai titik kritis di mana AI dapat mengubah bahasa manusia menjadi kode. Transisi dari insinyur manusia ke insinyur digital kemungkinan besar akan menjadi salah satu titik perubahan teknologi terpenting dalam kehidupan kita.
Kami masih dalam tahap awal transformasi ini. Alat kecerdasan buatan seperti BabyAGI dan AutoGPT telah menangkap imajinasi publik. Namun meskipun asisten pengkodean seperti Github Copilot menunjukkan peningkatan, mereka masih sangat terbatas, sebagian besar berfungsi sebagai pelengkapan otomatis untuk ide yang sudah diimplementasikan dalam kode.
Pabrik berbeda. Perusahaan ini didirikan pada tahun 2023 oleh mantan ahli teori string Matan Grinberg dan insinyur pembelajaran mesin Eno Reyes. Ketika saya bertemu Mattan, saya langsung tertarik pada visinya: masa depan di mana para insinyur dapat membuat pembangunan menjadi menyenangkan dengan mendelegasikan tugas-tugas yang mengganggu dan berfokus pada masalah-masalah sulit. Untuk melakukan hal ini, Matan dan Eno menciptakan "robot" pengkodean otonom.
Bot adalah insinyur kecerdasan buatan yang menangani tugas sehari-hari seperti peninjauan kode, debugging, dan pemfaktoran ulang. Tidak seperti produk yang sudah ada, bot Pabrik tidak mengharuskan Anda melakukan apa pun; bot dapat meninjau kode secara mandiri, menangani kesalahan, dan menjawab pertanyaan. Anda juga dapat menggunakan bot seperti pengembang junior, menggunakannya untuk bertukar pikiran dan berbagi pekerjaan fitur. Robot memiliki mekanisme perlindungan yang kuat, dan kecerdasannya ditargetkan pada kebutuhan pengguna, sehingga sulit bagi mereka untuk "berhalusinasi" atas jawaban yang salah.
Pembuatan kode akan menjadi salah satu bidang paling transformatif dalam revolusi AI, dan Pabrik memiliki semua alat yang diperlukan untuk mencapai kesuksesan.
*Tim. Mattan, CEO Factory, adalah ahli teori string di Universitas Princeton tempat dia membayangkan singularitas lubang hitam. Eno bekerja sebagai insinyur pembelajaran mesin di Hugging Face dan secara pribadi menangani proses rekayasa yang membosankan. Ini adalah tim yang unik.
Kepraktisan. Meskipun robot belum dapat melakukan tugas sebaik insinyur manusia, mereka masih dapat melakukan tugas yang dibenci para insinyur. Insinyur dapat menyerahkan pekerjaan yang membosankan dan berulang-ulang kepada Pabrik.
kecepatan. Pabrik telah mencapai sesuatu yang luar biasa hanya dalam beberapa bulan. Sementara yang lain masih membayangkan insinyur kecerdasan buatan, Matan dan Eno sudah mengembangkannya. Mereka dengan cepat meningkatkan produk unggulan ini.
Kisah perkembangan manusia adalah salah satu pelepasan tugas-tugas yang berulang, memungkinkan kita untuk beralih ke tugas-tugas yang lebih kompleks. Ketika manusia menemukan pertanian, pada dasarnya mereka melepaskan kemampuan kita untuk membangun kota. Setelah Revolusi Industri, kami membuat roket yang membawa manusia ke bulan. Generasi berikutnya memiliki misi untuk membebaskan manusia dari pekerjaan online yang membosankan dan mendorong batas teknologi lebih jauh.
Ketika satu-satunya batasan hanyalah imajinasi manusia, apa yang akan kita bangun selanjutnya?
— Markie Wagner, pendiri dan CEO Delphi Labs
Penerjemah: Jane
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Sektor AI: Ikhtisar Teknologi Terkini dan Peluang Investasi
Sumber: Biro Penerjemahan Dewa 36Kr
Catatan Editor: Teknologi kecerdasan buatan berkembang dengan pesat, dan ada banyak perusahaan rintisan di bidang kecerdasan buatan yang menonjol. Dalam artikel ini, mari kita lihat startup AI menjanjikan mana yang telah diambil oleh investor seperti Sequoia Capital dan Kleiner Perkins Caufield & Byers. Artikel ini merupakan hasil kompilasi dan semoga dapat menginspirasi Anda.
Jika Anda hanya punya waktu beberapa menit, berikut adalah startup paling menarik tentang kecerdasan buatan yang harus diketahui oleh investor, operator, dan pendiri.
Kecerdasan buatan menjadi benang merah kisah teknologi tahun ini. Sejak seri “Untuk Ditonton dalam AI” yang terakhir, bidang ini terus menarik modal, bakat, dan perhatian. Tentu saja, tidak semua perhatian bersifat positif. Meskipun ada kegembiraan yang meluas mengenai kemampuan teknologi ini, selama empat bulan terakhir para pelaku industri terkemuka telah menyatakan keprihatinan mereka dan regulator telah mulai merancang beberapa perlindungan. Dalam beberapa bulan dan tahun mendatang, kecerdasan buatan akan memberikan dampak besar pada kehidupan kita dan menciptakan pemenang dan pecundang baru di seluruh dunia.
Seri "Untuk Ditonton" kami dirancang untuk membantu pembaca bersiap menghadapi masa depan dan membayangkan masa depan dengan lebih jelas. Ini adalah titik awal yang baik bagi mereka yang ingin memahami teknologi yang muncul di bidang kecerdasan buatan dan memanfaatkan perubahan yang terjadi. Untuk melakukan hal ini, kami mengundang investor dan pendiri paling mengesankan di bidang kecerdasan buatan untuk memperkenalkan startup yang mereka yakini paling menjanjikan.
1. Hidup
Menggunakan kecerdasan buatan untuk meningkatkan teknologi IVF
Dalam setiap proses reproduksi, ada saat-saat yang memerlukan pengambilan keputusan oleh manusia, dan dua kaitan paling relevan dengan IVF adalah "stimulasi ovarium" dan "seleksi embrio".
"Stimulasi ovarium" mengacu pada penentuan dosis obat yang diterima pasien untuk merangsang pertumbuhan folikel di ovarium, dan kapan harus memberikan suntikan pemicu untuk merangsang folikel melepaskan sel telur. Pemilihan waktu pemicu sangat penting; jika terlalu dini, Anda mungkin mendapatkan telur yang belum matang; jika terlambat, Anda mungkin mendapatkan telur yang terlalu matang, atau Anda mungkin tidak mendapatkan telur sebanyak mungkin.
"Seleksi embrio" mengacu pada pemilihan sel telur yang telah dibuahi untuk digunakan dan ditanamkan. Saat ini, dokter dan ahli embriologi, seperti kebanyakan profesional medis, mendasarkan keputusan mereka pada kombinasi pengalaman dan pelatihan mereka sendiri, sistem penilaian morfologi, dan trial and error. Jika dosis atau waktunya tidak tepat dalam satu siklus, mereka akan menyesuaikannya pada siklus berikutnya. Hal ini memerlukan kompetensi profesional dokter yang sangat tinggi, dan pada saat ini, dokter memiliki tingkat keterampilan yang berbeda-beda, dan keterampilan mereka sangat penting untuk mencapai hasil. Untuk kesuburan, pasar yang pasokannya sangat terbatas, hal ini berarti harganya yang mahal, terutama jika Anda ingin melihat hasil yang optimal.
Alife sedang membangun alat kecerdasan buatan untuk meningkatkan hasil fertilisasi in vitro (IVF). Perusahaan ini menggunakan alat kecerdasan buatan untuk memberi para praktisi “kekuatan super” guna meningkatkan akurasi pengambilan keputusan mereka dengan memanfaatkan kumpulan data masukan dan hasil yang sangat besar. Kini, melalui antarmuka sederhana, dokter dapat memasukkan karakteristik pasien dan menerima rekomendasi tepat pada momen-momen penting dalam perjalanan kesuburan, yang diperoleh dari hasil ribuan siklus sebelumnya. Kumpulan data ini berasal dari sejumlah besar informasi pasien yang sudah ada, dan menjadi lebih baik seiring setiap pasien menggunakan produk Alife.
Alat-alat ini akan mengubah sifat industri kesuburan. Penelitian Alife menunjukkan bahwa model pembelajaran mesin mereka dapat membantu dokter mengoptimalkan 50% waktu pemicuan dan membantu mengambil rata-rata tiga sel telur yang lebih matang, dua sel telur yang telah dibuahi, dan satu embrio lagi. Produk Alife secara signifikan dapat memperluas akses terhadap perawatan infertilitas, mengurangi biaya per pasien dengan mengurangi dosis obat yang diperlukan dan meningkatkan tingkat keberhasilan siklus IVF. Hal ini juga akan memberikan kesempatan yang sama bagi para dokter, memberikan mereka yang tidak memiliki pengalaman langsung, akses terhadap pengetahuan dan informasi yang lebih luas.
Pada akhirnya, Anda dapat membayangkan alat Alife menyediakan semua informasi untuk momen-momen penting dalam suatu proses dan memungkinkan praktisi selain dokter untuk melakukan operasi, sehingga secara signifikan mengubah struktur biaya dan ketersediaan industri. Terlebih lagi, pengobatan presisi berbasis data, yang menambah (atau akhirnya menggantikan) penilaian seseorang dengan rekomendasi yang dipersonalisasi, tidak hanya terjadi di dunia IVF. Ada ribuan momen seperti ini dalam bidang kedokteran, saat kita memiliki kesempatan untuk menggunakan data untuk mengubah hasil dan akses terhadap prosedur dan perawatan penting secara signifikan.
—Rebecca Kaden, mitra umum, Union Square Ventures
2. Kumpulkan
Pencarian Perusahaan
Di tempat kerja, menemukan informasi yang Anda perlukan saat Anda membutuhkannya seharusnya cepat dan mudah. Karena setiap orang menggunakan banyak aplikasi untuk menyelesaikan pekerjaannya, dan sebagai hasilnya menghasilkan banyak data dan dokumen, hal ini tidak selalu terjadi. Ketika “pengetahuan” tumbuh secara eksponensial dan sifat pekerjaan semakin terdistribusi, dibutuhkan waktu yang lebih lama untuk menemukan pengetahuan yang ada. Dengan kata lain, cukup sulit untuk “mencari sesuatu” di tempat kerja.
Untuk membantu perusahaan mengatasi masalah ini, Arvind Jain dan timnya membangun Glean, sebuah platform pencarian tempat kerja terpadu yang didukung AI. Ini membekali karyawan dengan asisten kerja intuitif yang membantu mereka menemukan apa yang mereka butuhkan dan secara proaktif menemukan apa yang harus mereka ketahui.
Misi perusahaan ini sederhana sejak awal: membantu orang menemukan jawaban atas semua pertanyaan di tempat kerja dengan lebih cepat, dengan lebih sedikit rasa frustrasi dan waktu yang terbuang. Namun hasil perusahaan kemudian berkembang jauh melampaui pencarian. Misalnya, Glean tidak hanya menelusuri semua aplikasi dan basis pengetahuan di tempat kerja (Slack, Teams, Google Drive, Figma, Dropbox, Coda, dll.), namun juga memahami bahasa dan konteks alami, berdasarkan peran orang-orang di dalam/di luar perusahaan. Hubungan mempersonalisasi interaksi pengguna. Ini dengan cerdas menampilkan informasi perusahaan Anda yang paling populer dan terverifikasi, membantu Anda menemukan apa yang diketahui tim Anda dan tetap konsisten, semuanya dengan cara yang diizinkan.
Ketika organisasi menjadi lebih terdistribusi dan pengetahuan menjadi lebih terfragmentasi, asisten kerja yang intuitif seperti Glean tidak lagi menjadi alat yang bagus untuk dimiliki, namun menjadi alat yang penting untuk meningkatkan produktivitas karyawan. Pertumbuhan perusahaan akan meruntuhkan hambatan yang menghambat kemajuan dan menciptakan pengalaman kerja yang lebih positif dan produktif.
Selain itu, teknologi pencarian Glean memungkinkannya menghadirkan AI generatif ke tempat kerja sambil mematuhi persyaratan izin dan manajemen data yang ketat di perusahaan. Saat ini, salah satu kendala utama yang menghalangi perusahaan untuk menerapkan aplikasi AI ke dalam produksi adalah ketidakmampuan mereka untuk menerapkan kontrol tata kelola yang tepat. Dengan memasukkan izin data real-time ke dalam lingkungan lokal perusahaan, Glean telah menjadi solusi ideal untuk membantu perusahaan memecahkan masalah tata kelola dalam skala besar dan memungkinkan perusahaan dengan percaya diri memanfaatkan data internal mereka untuk pelatihan model dan inferensi, sehingga memanfaatkan tingkat perusahaan. Platform data AI /Peran penyimpanan vektor.
3. Tombak
Penyimpanan dan Pengelolaan Data Multimoda
Kita semua pernah memainkan Midjourney, dan sebagian besar dari kita pernah melihat demo GPT-4. Midjourney (teks ke gambar) dan GPT-4 (gambar ke teks/kode) menggambarkan kemungkinan ketika model menjadi multimodal, menjembatani berbagai bentuk media seperti teks, gambar, dan audio. Meskipun sebagian besar kegemaran AI saat ini berkisar pada model berbasis teks, model multimodal adalah kunci untuk membangun representasi dunia yang lebih akurat.
Saat kita memulai gelombang penerapan AI berikutnya di industri seperti robotika, layanan kesehatan, manufaktur, hiburan, dan periklanan, semakin banyak perusahaan yang akan membangun model multimoda. Perusahaan seperti Runway dan Flair.ai adalah contoh yang baik dari pemimpin baru di bidangnya yang telah melihat besarnya permintaan pengguna terhadap produk mereka, sementara perusahaan yang sudah ada seperti Google telah mulai meluncurkan kemampuan multimoda serupa.
Namun, penggunaan model multimodal menimbulkan tantangan: bagaimana cara menyimpan dan mengelola data? Format penyimpanan tradisional seperti Parket tidak dioptimalkan untuk data tidak terstruktur, sehingga tim model bahasa yang besar mengalami kinerja yang lambat saat memuat, menganalisis, mengevaluasi, dan melakukan debug data. Selain itu, alur kerja model bahasa yang besar lebih rentan terhadap kesalahan halus karena kurangnya satu sumber kebenaran. Lance adalah perusahaan terbaru yang muncul untuk mengatasi tantangan ini. Perusahaan seperti Midjourney dan WeRide mengonversi kumpulan data berskala petabyte ke dalam format Lance, yang memberikan peningkatan kinerja yang signifikan dan biaya penyimpanan tambahan yang jauh lebih rendah dibandingkan dengan format tradisional seperti Parket dan TFRecords.
Lance tidak berhenti pada penyimpanan, mereka menyadari perlunya membangun kembali seluruh tumpukan manajemen data mereka agar lebih selaras dengan dunia yang kita tuju, di mana data multimodal yang tidak terstruktur akan menjadi aset perusahaan yang paling berharga. Produk platform pertama mereka, LanceDB (saat ini dalam versi beta pribadi), memberikan pengalaman tertanam yang lancar bagi pengembang yang ingin membangun fungsionalitas multimodal ke dalam aplikasi mereka.
4. Keamanan Tidak Normal
Menahan gelombang serangan siber yang didukung AI
Saya seorang optimis yang tidak tahu malu dalam hal AI generatif, tetapi saya tidak naif dalam hal ini. Misalnya, saya khawatir dengan maraknya serangan "rekayasa sosial" seperti spear phishing, yang sering kali menggunakan email untuk mengekstrak informasi sensitif. Sejak ChatGPT menjadi populer tahun lalu, kejadian serangan semacam ini telah meningkat secara dramatis.
Pada tahun lalu, jumlah serangan per 1.000 orang telah melonjak dari kurang dari 500 menjadi lebih dari 2.500, menurut Abnormal Security. Kecanggihan serangan juga meningkat secara dramatis. Sama seperti siswa mana pun yang dapat menggunakan ChatGPT untuk menulis esai yang sempurna, ChatGPT juga dapat digunakan untuk mengirim pesan penipuan yang tata bahasanya sempurna dan dipersonalisasi secara berbahaya.
Menurut FBI, serangan "kompromi email bisnis" yang ditargetkan seperti itu telah menyebabkan kerugian lebih dari $50 miliar sejak tahun 2013. Dan itu akan menjadi lebih buruk. Setiap hari, banyak sekali penjahat dunia maya dan pelaku kejahatan lainnya yang mengeksploitasi alat topi hitam seperti “WormGPT,” sebuah chatbot yang dirancang untuk menambang data malware guna mengatur kampanye penipuan yang paling meyakinkan dan berskala besar untuk melakukan aktivitas penipuan.
Untungnya, salah satu pendiri Abnormal, Evan Reiser dan Sanjay Jeyakumar, bekerja keras menggunakan kecerdasan buatan untuk memerangi ancaman ini. Anda dapat menganggap ini sebagai penggunaan AI untuk melawan AI. Secara historis, sistem keamanan email memindai tanda tangan dari perilaku buruk yang diketahui, seperti alamat IP tertentu atau upaya mengakses informasi pengenal pribadi (PII).
Memanfaatkan kekuatan kecerdasan buatan, Abnormal merongrong semua ini. Karena banyak serangan tampak sah berkat kecerdasan buatan, pendekatan Abnormal adalah memahami sepenuhnya perilaku baik yang diketahui sehingga penyimpangan halus pun dapat diketahui. Perusahaan ini menggunakan model bahasa skala besar untuk membangun representasi rinci tentang cara kerja digital internal dan eksternal, seperti siapa yang biasanya berbicara satu sama lain dan konten apa yang cenderung berinteraksi dengan mereka. Jika rekan saya Reid Hoffman mengirimi saya email dan berkata, "Hei, tolong kirimkan saya informasi terbaru tentang Inflection.AI." Mesin AI Abnormal akan segera mengetahuinya. , Reed jarang memulai dengan "hei", jarang mengirimkan satu kalimat pun, dan dia tidak pernah meminta saya untuk mengiriminya file tentang Infleksi.AI. (Sebagai salah satu pendiri dan anggota dewan perusahaan, dia memiliki lebih banyak akses terhadap dokumen-dokumen ini dibandingkan saya!).
Tidak mengherankan, seiring dengan meningkatnya kekhawatiran keamanan seputar AI generatif, permintaan pelanggan korporat Abnormal pun meningkat. Saya rasa kesuksesan Abnormal sangat menggembirakan karena mampu memanfaatkan AI dengan begitu cepat untuk mengatasi permasalahan yang sedang dipercepat oleh AI. Dalam periode perubahan teknologi yang disruptif, pelaku kejahatan sering kali menikmati keuntungan jangka panjang. Bagaimanapun, mereka dapat memanfaatkan inovasi tanpa harus mengkhawatirkan kualitas produk, keamanan, atau regulator yang belum membuat undang-undang baru.
5. Debu
Berdayakan pekerja berpengetahuan
Jelas bahwa model bahasa yang besar akan meningkatkan efisiensi pekerja pengetahuan. Namun tidak jelas bagaimana hal itu akan dilakukan. Dust sedang mencoba mencari tahu. Manajer pengetahuan tidak akan banyak membantu dalam perusahaan jika mereka tidak dapat mengakses data internal. Jadi Dust membangun platform yang mengindeks, menyematkan, dan memperbarui data internal perusahaan secara real-time (Notion, Slack, Drive, GitHub) dan memaparkannya ke produk yang didukung oleh model bahasa besar.
Salah satu pendiri Dust, Gabriel Hubert dan Stanislas Polu, menjual perusahaannya ke Stripe dan bekerja di sana selama lima tahun. Mereka telah melihat secara langsung bagaimana perusahaan-perusahaan yang berkembang pesat berjuang melawan skala. Mereka telah melihat secara langsung apa yang disebut "utang informasi", dan kini mereka berfokus pada penerapan model bahasa besar untuk memecahkan beberapa permasalahan utama yang terkait dengannya. Saat ini, Dust sedang menjajaki aplikasi berikut pada platformnya:
6. Kotak Label
Rilis data bisnis
“Kebangkitan big data” telah berlangsung selama lebih dari 20 tahun, dan meskipun perusahaan terus menyerap lebih banyak data dibandingkan sebelumnya, banyak perusahaan masih kesulitan menggunakan data ini untuk mendapatkan wawasan dari model kecerdasan buatan. Pemrosesan dan interpretasi data tetap menjadi bagian proses AI yang paling membosankan dan mahal, tetapi juga yang paling penting untuk hasil berkualitas tinggi. Bahkan dengan peningkatan model bahasa besar yang telah dilatih sebelumnya, perusahaan masih perlu fokus pada penggunaan data milik mereka sendiri (di berbagai modalitas) untuk menciptakan AI generatif yang diposisikan secara unik untuk memberikan layanan dan wawasan yang berbeda, dan meningkatkan efisiensi operasional.
Labelbox memecahkan tantangan ini dengan menyederhanakan cara bisnis memasukkan kumpulan data ke dalam model AI. Ini membantu tim data dan pembelajaran mesin menemukan data yang tepat, memproses dan menafsirkannya, memasukkan model ke aplikasi, dan terus mengukur dan meningkatkan kinerja.
Platform baru Labelbox memanfaatkan kecerdasan buatan generatif. Model Foundry memungkinkan tim bereksperimen dengan cepat dengan model dasar AI dari semua penyedia sumber tertutup dan terbuka, memungkinkan mereka melakukan pra-pelabelan data dan bereksperimen dengan cepat hanya dengan beberapa klik. Dengan cara ini, mereka dapat memahami model mana yang memiliki performa terbaik pada datanya. Model Foundry secara otomatis menghasilkan metrik kinerja terperinci untuk setiap eksperimen yang dijalankan sambil membuat versi hasilnya.
Dampaknya bisa sangat luas. Secara tradisional, manusia menghabiskan waktu berhari-hari untuk menyelesaikan tugas sederhana namun memakan waktu, seperti mengklasifikasikan daftar e-commerce yang berisi beberapa paragraf teks. Dengan GPT-4, tugas ini dapat diselesaikan dalam beberapa jam. Model Foundry memungkinkan perusahaan menemukan sendiri cara-cara efisien ini.
Ini bukan satu-satunya contoh. Hasil awal menunjukkan bahwa lebih dari 88% tugas pelabelan dapat dipercepat dengan satu atau lebih model dasar. Labelbox memungkinkan siapa saja untuk memberi label awal pada data hanya dengan beberapa klik, tanpa perlu mengkode dan memasukkan data ke dalam model. Alat ini dirancang untuk memberdayakan tim untuk bekerja secara kolaboratif dan memanfaatkan keahlian lintas fungsi untuk mempertahankan pengawasan manual terhadap penjaminan kualitas data. Kemampuan ini mendemokratisasi akses terhadap kecerdasan buatan dengan memungkinkan para ahli model bahasa dan perusahaan kecil dan menengah mengevaluasi model dengan mudah, memperkaya kumpulan data, dan berkolaborasi untuk membangun aplikasi cerdas.
Labelbox terbukti secara signifikan mengurangi biaya dan meningkatkan kualitas model untuk perusahaan terbesar di dunia, termasuk Walmart, Procter & Gamble, Genentech, dan Adobe.
7. Landasan pacu
Suite Kreatif Baru
Kecerdasan buatan ada dimana-mana dan semakin menjadi sebuah komoditas. Dalam kebanyakan kasus, perusahaan menggunakan AI sebagai chatbots untuk memperkaya aplikasi yang sudah ada. Hanya sedikit aplikasi AI yang menciptakan kembali pengalaman produk, menggunakan teknologi ini untuk mengubah secara mendasar cara kita berinteraksi dengan produk, seperti mesin pencari Google yang mengubah cara kita menjelajah internet, atau Instagram mengubah cara kita berbagi foto dari ponsel. Dengan cara yang sama. Penerapan AI ini memerlukan pemahaman mendalam tentang pengalaman pengguna yang ada, pemikiran produk yang visioner, dan teknologi mutakhir.
Runway adalah contoh utama perusahaan yang menggunakan penelitian AI terapan untuk menata ulang pengalaman kreatif dan membangun rangkaian materi iklan yang benar-benar baru.
Sejak Oktober 2022, Runway telah mengembangkan lebih dari 30 "alat ajaib" AI yang mencakup video, gambar, 3D, dan teks, melayani seluruh aspek proses kreatif, mulai dari praproduksi hingga pascaproduksi. Basis klien mereka mencakup perusahaan Fortune 500 dan Global 2000 seperti The Late Show with Stephen Colbert dari CBS, New Balance, Harbour Picture Video, Publicis) dan Google. Platform ini juga telah digunakan untuk mengedit film-film nominasi Oscar seperti film hit Hollywood Everything Everywhere All at Once.
8. Batas Baru
Membentuk kembali nasib sel
Sel adalah sistem komputer paling kompleks di dunia. Seperti chip komputer, DNA terdiri dari unit-unit dasar yang menciptakan fungsi-fungsi kompleks. Berbeda dengan kode berbasis bit, kode berbasis atom bersifat acak dan hierarkis. Satu sistem bergantung pada sistem lain, yang pada gilirannya bergantung pada sistem fisik lainnya, yang masing-masing dipengaruhi oleh panas, keasaman, dan molekul dalam lingkungan mikro sel.
Terlepas dari saling ketergantungan ini, kode mesin seluler (DNA) dapat menjalankan berbagai program secara efisien. Meskipun sel hati dan sel kulit Anda mengandung genom yang sama, jenis sel ini terlihat, terasa, dan berfungsi secara berbeda. Mengapa? Karena mereka menjalankan program epigenetik yang berbeda.
Pada tahun 2006, Takahashi dkk menggunakan kombinasi empat protein faktor transkripsi (TF) untuk memprogram ulang sel dewasa menjadi sel induk, yang memelopori bidang pemrograman ulang epigenetik. Faktor transkripsi adalah protein yang mengatur gen, pada dasarnya mengubah “program” yang sedang berjalan. Penemuan Takahashi dan Yamanaka mengarah pada penciptaan sel induk berpotensi majemuk terinduksi (iPSCs) dan memenangkan Hadiah Nobel. Sejak itu, banyak kelompok penelitian mulai menerapkan kombinasi TF unik untuk mengubah keadaan sel, meremajakan sel yang rusak, dan memulihkan fenotip sel muda.
Meskipun pemrograman ulang epigenetik menjadi lebih mudah dilakukan, hal ini tetap bukan masalah sepele. Tim harus membedakan kombinasi TF mana yang efektif dalam transisi sel dari keadaan A ke keadaan B yang diinginkan. Misalnya, kombinasi TF di masa depan memungkinkan kita mengubah sel yang sakit menjadi sel sehat, sehingga mengembangkan kelas obat baru. Kita memerlukan layar pemrograman ulang berskala sangat besar karena kombinasi TF yang tepat tidak diketahui di banyak area aplikasi. Terdapat lebih dari 1.500 TF manusia asli, sehingga diperlukan metode pencarian yang lebih efisien. Kami yakin NewLimit sedang merancang pendekatan seperti itu.
Didukung oleh kemajuan dalam teknologi pengurutan sel tunggal dan pembelajaran mesin, NewLimit mengubah disiplin yang sebelumnya manual menjadi sains berbasis data. Perusahaan ini memiliki pembagian kerja yang sehat antara ahli biologi molekuler dan ahli biologi komputasi, sehingga meletakkan dasar budaya yang diperlukan untuk membangun platform loop tertutup yang semakin efisien. Menggabungkan keahlian dan pembacaan multimodal (scRNA-Seq, scATAC-Seq, dll.), NewLimit bertujuan untuk menemukan remodeler terapeutik untuk mengobati penyakit yang sebelumnya sulit disembuhkan.
Dalam setiap putaran eksperimen, NewLimit menggunakan teknologi bahasa mesin untuk:
Selain timnya yang luar biasa, kecakapan teknis, dan visi ambisiusnya, kami juga mengagumi semangat pragmatis NewLimit. Meskipun perusahaan belum mengumumkan rincian strategi bisnis awalnya kepada publik, kami yakin pendekatan ini kreatif, mengurangi risiko secara wajar, dan berpotensi membawa perubahan bagi umat manusia. Tim pendiri setuju bahwa platform bioteknologi dapat disamakan dengan proyek ilmiah yang mahal tanpa menghasilkan aset jangka pendek. Untuk mencapai tujuan ini, NewLimit telah transparan dan membuat katalog kemajuan teknologinya sejak awal.
9. Tepi kolam renang
Kecerdasan Buatan Dasar untuk Pengembangan Perangkat Lunak
OpenAI berfokus pada kecerdasan buatan secara umum, DeepMind berfokus pada penemuan ilmiah, dan kasus penggunaan mendasar ketiga dari kecerdasan buatan adalah memahami dan membuat perangkat lunak.
GPT-4 sudah tertanam dalam alur kerja pengembang berpengalaman dan pemula. Namun perubahan paradigma ini masih dalam tahap awal. Mengekstrapolasi dari beberapa bulan terakhir, pemrograman yang dibantu AI akan segera tersebar luas. Ketika tren ini berkembang lebih jauh, bahasa alami akan menjadi landasan abstrak di mana perangkat lunak dibangun.
Meskipun perusahaan lain telah merilis model kode murni berskala besar seperti StarCoder, belum ada metode yang mampu menandingi performa GPT-4. Saya rasa ini karena model yang dilatih hanya pada kode tidak dapat menghasilkan kemampuan pengembangan perangkat lunak yang kuat. Begitulah cara saya bertemu Poolside. Perusahaan ini didirikan oleh Jason Warner, mantan chief technology officer GitHub, dan Eiso Kant, mantan pendiri source{d}, perusahaan kecerdasan buatan kode penelitian pertama di dunia.
Poolside unik karena menggunakan pendekatan model dasar OpenAI tetapi hanya fokus pada satu fungsi: pembuatan kode. Strategi teknologi mereka bergantung pada fakta bahwa kode dapat dieksekusi, memungkinkan adanya umpan balik langsung dan otomatis selama proses pembelajaran. Hal ini memungkinkan pembelajaran penguatan melalui eksekusi kode, sebuah alternatif menarik untuk pembelajaran penguatan berdasarkan umpan balik manusia (RLHF). Ini adalah sesuatu yang mulai dieksplorasi Esso sejak tahun 2017.
10. Mistral
Pesaing OpenAI di Prancis
Baru-baru ini, Paris disinari oleh ledakan proyek di bidang kecerdasan buatan generatif. Mungkin Anda akan bertanya kenapa? Menurut saya, Paris memiliki kumpulan talenta kelas dunia terbesar di bidang AI generatif yang berada di luar cakrawala peristiwa OpenAI. Dari proyek-proyek ini, yang paling berani tidak diragukan lagi adalah Mistral. Mistral didirikan oleh Guillaume Lample, Arthur Mensch dan Timothe Lacroix dengan misi untuk membangun model bahasa sumber terbuka terbaik. Tujuannya adalah untuk membangun ekosistem yang berkembang di sekitar model ini.
Saya telah mengenal Guillaume selama empat tahun, dan kami berdua sangat terlibat dalam penerapan model bahasa besar pada bidang matematika, khususnya matematika formal. Saat bekerja di OpenAI dan Meta, kami mengembangkan hubungan kompetitif yang bersahabat. Guillaume adalah salah satu peneliti paling berbakat yang pernah saya ajak bekerja sama, dan saya mendapat kehormatan melihatnya beralih dari penelitian di Meta hingga mendirikan Mistral. Dalam prosesnya, saya juga bertemu Arthur Mensch. Saya selalu terkesan dengan karyanya, terutama Chinchilla, yang mendefinisikan ulang apa artinya melatih model bahasa besar secara efisien, dan RETRO, sebuah pendekatan untuk pemodelan bahasa yang disempurnakan dengan pengambilan yang, menurut saya, masih belum sepenuhnya dieksplorasi.
Sekarang, mari kita gali apa yang membuat Mistral Mistral. Visi startup ini adalah membangun ekosistem berdasarkan model open source terbaik di kelasnya. Ekosistem ini akan berfungsi sebagai landasan peluncuran proyek, tim, dan perusahaan, mempercepat laju inovasi dan penggunaan kreatif model bahasa besar.
Ambil contoh pembelajaran penguatan berdasarkan umpan balik manusia (RLHF). Biasanya, melakukan RLHF memakan waktu dan oleh karena itu mahal. Ini melibatkan "penandaan" tindakan AI secara manual, yang mungkin memerlukan banyak pekerjaan. Upaya ini hanya akan bermanfaat jika potensi model AI cukup baik. Bagi perusahaan besar seperti OpenAI, berinvestasi dalam proses ini adalah hal yang masuk akal, dan perusahaan memiliki sumber daya untuk mewujudkannya. Namun komunitas open source tradisional biasanya membutuhkan "pemimpin" untuk melangkah maju dan memikul tanggung jawab penting ini.
Mistral mempunyai peluang untuk melakukan hal tersebut, dengan berinvestasi pada model open source untuk RLHF. Dengan melakukan hal ini, Mistral akan membuka pintu bagi ledakan inovasi pada masa Kambrium. Pengembang sumber terbuka akan memiliki akses ke model berlabel jelas yang dapat mereka adaptasi dan sesuaikan untuk berbagai kebutuhan. Pemenang utamanya adalah pasar yang lebih luas, dan kita akan memiliki akses terhadap kasus penggunaan yang lebih spesifik dan menarik dibandingkan yang dapat dihasilkan oleh satu perusahaan tertutup saja.
Siapa pun yang memiliki model open source terbaik akan menarik lebih banyak minat dan nilai. Saya optimistis pada Mistral karena tim secara aktif mendorong batas efisiensi/kinerja. Pada saat yang sama, bakat Mistral di bidang ini adalah yang terbaik di dunia.
11. Bereaksi
Robot Industri yang Lebih Cerdas
Kita sering mendengar prediksi bahwa dalam jangka panjang, kecerdasan buatan dan robotika akan menambah atau mengotomatiskan tugas-tugas manusia. Saat ini, hal ini semakin menjadi keharusan bisnis yang mendesak.
Pada tahun 2030, populasi usia kerja di Eropa diperkirakan akan berkurang sebesar 13,5 juta, dan biaya tenaga kerja meningkat pada tingkat tercepat dalam lebih dari 20 tahun. Dengan maraknya e-commerce, gudang berada di bawah tekanan yang lebih besar dan tantangan bagi bisnis untuk tetap kompetitif menjadi semakin besar.
55% biaya operasional gudang berasal dari pengambilan pesanan, namun situasinya tidak optimis bagi perusahaan yang ingin beralih ke sistem otomatis. Tak satu pun dari aplikasi mencolok yang kita kenal di SaaS (perangkat lunak sebagai layanan) yang dipimpin AI, atau sejumlah besar produk sumber terbuka yang kita lihat di bagian lain ekosistem, belum diterapkan pada robotika.
Sebaliknya, bisnis yang ingin mengotomatisasi pengambilan dan pengepakan dihadapkan pada pilihan solusi robotik yang mahal dan tidak fleksibel. Mereka harus menavigasi sejumlah antarmuka berpemilik yang memerlukan waktu dan keahlian pemrograman yang signifikan. Sistem ini juga kesulitan menghadapi perubahan bauran produk, memerlukan intervensi manusia secara rutin, dan berkinerja buruk saat menangani situasi ekstrem.
Rahasia memecahkan masalah ini. Perangkat lunaknya didasarkan pada lingkungan simulasi yang kuat yang melatih lengan robot untuk memahami nuansa spasial dan fisik dari setiap potensi lingkungan dunia nyata. Setelah diterapkan, sistem akan dioptimalkan dengan terus belajar dari data dunia nyata. Hal ini juga berarti mereka dapat mengatasi tantangan dalam mengambil barang-barang yang biasanya sulit didapat seperti barang elektronik, tekstil, buah-buahan, ubin dan kayu.
Yang paling menarik, tumpukan robotika mereka menggunakan model bahasa besar untuk memungkinkan kontrol bahasa alami robot yang intuitif. Mereka mengembangkan model konverter yang disebut "PickGPT" yang memungkinkan pengguna memberikan instruksi dan umpan balik kepada robot melalui suara atau teks. Dengan cara ini, siapa pun dapat meminta robot untuk melakukan tugas yang diinginkan, terlepas dari tingkat pengetahuan teknisnya.
Secret menggabungkan dua bidang keahlian para pendirinya. CEO Ralf Gulde telah bekerja di persimpangan antara kecerdasan buatan dan robotika, sementara CTO Marc Tusher berspesialisasi dalam pembelajaran mendalam. Pasangan ini melakukan penelitian peer-review pada mata pelajaran ini di Universitas Stuttgart, salah satu universitas paling bergengsi di Jerman untuk otomasi dan manufaktur industri.
Meskipun merupakan perusahaan muda, Sereact telah menarik banyak mitra, termasuk Daimler Truck, Schmalz, Zenfulfillment, Zimmer Group ) dan Material Bank. Hal ini menunjukkan bahwa terdapat potensi peluang pasar yang sangat besar di industri pengambilan dan pengepakan.
Di luar kasus penggunaan yang jelas di gudang e-commerce, baik pengambilan pesanan atau pembongkaran kotak, terdapat sejumlah kasus penggunaan lainnya. Misalnya, dalam manufaktur tradisional, ada proses yang memakan waktu yang disebut perakitan, yang melibatkan pengumpulan bagian-bagian halus yang diperlukan untuk perakitan dengan susah payah. Lengan robot secara historis kesulitan untuk menangkap bagian-bagian kecil dan memilah bagian-bagian individual di lingkungan yang berantakan. Perangkat lunak Sereact dapat mengidentifikasi bagian-bagian ini dan memilih gripper yang tepat untuk memilihnya.
12. Lamini
Mesin model bahasa skala besar yang dibuat khusus
Kini, setiap perusahaan berusaha mengintegrasikan kecerdasan buatan ke dalam bisnis perusahaannya. Perusahaan-perusahaan terbesar di dunia menyadari potensi kecerdasan buatan, dengan 20% CEO di S&P 500 menyebutkan AI dalam laporan pendapatan kuartal pertama mereka. Model bahasa besar dapat meningkatkan efisiensi bisnis secara signifikan dengan mempercepat fungsi inti seperti dukungan pelanggan, penjualan keluar, dan pengkodean. Model bahasa besar juga dapat meningkatkan pengalaman produk inti dengan menjawab pertanyaan pelanggan menggunakan asisten berbasis AI, atau menciptakan alur kerja AI generatif baru untuk menyenangkan pelanggan.
Mengingat perusahaan besar cenderung lambat dalam mengadopsi teknologi baru, kami terkejut melihat betapa cepatnya perusahaan mulai membangun dengan AI. Tidak mengherankan jika banyak perusahaan ingin membangun model dan solusi AI mereka sendiri. Setiap bisnis memiliki kumpulan data pelanggan, sering kali sebagai bagian dari parit bisnis intinya. Perusahaan-perusahaan ini melihat adanya risiko dalam mengirimkan data mereka yang paling berharga ke API model dasar atau startup yang keandalannya tidak pasti. Meskipun ada masalah privasi data, model bahasa publik berskala besar seperti GPT-4 atau Claude dilatih sepenuhnya pada data terbuka sehingga tidak memiliki kemampuan penyesuaian untuk kasus penggunaan khusus perusahaan dan segmen pelanggan.
Beberapa perusahaan teknologi, seperti Shopify dan Canva, telah membentuk "Tim Harimau AI" internal untuk menggunakan model sumber terbuka siap pakai guna mengintegrasikan kecerdasan buatan ke seluruh bagian bisnis. Namun, sebagian besar perusahaan tidak memiliki sumber daya atau peneliti AI berpengalaman untuk membangun dan menerapkan model bahasa berskala besar berdasarkan data mereka sendiri. Mereka menyadari bahwa gelombang AI ini dapat menjadi momen transformasional bagi masa depan bisnis mereka, namun sejauh ini mereka belum mampu memanfaatkan atau mengendalikan pengembangan AI mereka sendiri.
Itu sebabnya kami sangat gembira dengan apa yang dilakukan Sharon Zhou dan Greg Diamos serta tim mereka di Lamini. Lamini adalah mesin model bahasa berskala besar yang memudahkan pengembang untuk melatih, menyempurnakan, menerapkan, dan meningkatkan model mereka sendiri dengan cepat menggunakan masukan manusia. Alat ini memberikan pengalaman pengembangan yang menyenangkan yang menghilangkan kompleksitas model AI dan, yang lebih penting, memungkinkan perusahaan membangun solusi AI berdasarkan data mereka sendiri tanpa harus mempekerjakan peneliti AI atau berisiko mengalami kebocoran data. Kami bekerja dengan Sharon dan Greg untuk pertama kalinya pada musim gugur lalu. Sejak saat itu, kami mempunyai kesempatan untuk mendukung tim pendiri yang ahli secara teknis dan berfokus pada pelanggan ini seiring mereka mewujudkan visi ambisius mereka untuk mengubah cara bisnis mengadopsi AI.
Secara khusus, penerapan model bahasa besar privat dengan Lamini menawarkan berbagai keuntungan dibandingkan menggunakan solusi publik. Memiliki tim teknik internal yang menangani proses pembangunan akan memastikan privasi data dan memungkinkan fleksibilitas yang lebih besar dalam pemilihan model serta seluruh komputasi dan tumpukan data. Model yang dibuat menggunakan Lamini juga mengurangi artefak, mengurangi latensi, memastikan runtime yang andal, dan biaya lebih rendah dibandingkan dengan API yang tersedia. Peningkatan kinerja ini berasal dari wawasan teknis inti yang dibangun oleh tim Lamini ke dalam produk berdasarkan penelitian selama puluhan tahun dan pengalaman industri seputar model AI dan optimalisasi GPU.
13. Pabrik
"Robot" Pengkodean Anda
Saat ini, jika Anda ingin komputer melakukan sesuatu untuk Anda, Anda harus menerjemahkan pemikiran Anda ke dalam "bahasa komputer", sebuah kode hypertext yang dapat dipahami oleh kompiler. Untuk menjadi seorang insinyur, Anda harus memutar otak Anda seperti mesin. Namun, kita mencapai titik kritis di mana AI dapat mengubah bahasa manusia menjadi kode. Transisi dari insinyur manusia ke insinyur digital kemungkinan besar akan menjadi salah satu titik perubahan teknologi terpenting dalam kehidupan kita.
Kami masih dalam tahap awal transformasi ini. Alat kecerdasan buatan seperti BabyAGI dan AutoGPT telah menangkap imajinasi publik. Namun meskipun asisten pengkodean seperti Github Copilot menunjukkan peningkatan, mereka masih sangat terbatas, sebagian besar berfungsi sebagai pelengkapan otomatis untuk ide yang sudah diimplementasikan dalam kode.
Pabrik berbeda. Perusahaan ini didirikan pada tahun 2023 oleh mantan ahli teori string Matan Grinberg dan insinyur pembelajaran mesin Eno Reyes. Ketika saya bertemu Mattan, saya langsung tertarik pada visinya: masa depan di mana para insinyur dapat membuat pembangunan menjadi menyenangkan dengan mendelegasikan tugas-tugas yang mengganggu dan berfokus pada masalah-masalah sulit. Untuk melakukan hal ini, Matan dan Eno menciptakan "robot" pengkodean otonom.
Bot adalah insinyur kecerdasan buatan yang menangani tugas sehari-hari seperti peninjauan kode, debugging, dan pemfaktoran ulang. Tidak seperti produk yang sudah ada, bot Pabrik tidak mengharuskan Anda melakukan apa pun; bot dapat meninjau kode secara mandiri, menangani kesalahan, dan menjawab pertanyaan. Anda juga dapat menggunakan bot seperti pengembang junior, menggunakannya untuk bertukar pikiran dan berbagi pekerjaan fitur. Robot memiliki mekanisme perlindungan yang kuat, dan kecerdasannya ditargetkan pada kebutuhan pengguna, sehingga sulit bagi mereka untuk "berhalusinasi" atas jawaban yang salah.
Pembuatan kode akan menjadi salah satu bidang paling transformatif dalam revolusi AI, dan Pabrik memiliki semua alat yang diperlukan untuk mencapai kesuksesan.
*Tim. Mattan, CEO Factory, adalah ahli teori string di Universitas Princeton tempat dia membayangkan singularitas lubang hitam. Eno bekerja sebagai insinyur pembelajaran mesin di Hugging Face dan secara pribadi menangani proses rekayasa yang membosankan. Ini adalah tim yang unik.
Kisah perkembangan manusia adalah salah satu pelepasan tugas-tugas yang berulang, memungkinkan kita untuk beralih ke tugas-tugas yang lebih kompleks. Ketika manusia menemukan pertanian, pada dasarnya mereka melepaskan kemampuan kita untuk membangun kota. Setelah Revolusi Industri, kami membuat roket yang membawa manusia ke bulan. Generasi berikutnya memiliki misi untuk membebaskan manusia dari pekerjaan online yang membosankan dan mendorong batas teknologi lebih jauh.
Penerjemah: Jane