Model Manus melampaui pengujian GAIA memicu kontroversi tentang jalur pengembangan AI dan keamanan

Model Manus menunjukkan kinerja luar biasa dalam uji Benchmark GAIA, memicu kontroversi mengenai jalur pengembangan AI

Baru-baru ini, model Manus mencapai hasil yang luar biasa dalam pengujian GAIA Benchmark, dengan kinerjanya melampaui model bahasa besar sekelas. Prestasi ini menunjukkan kemampuan luar biasa Manus dalam menangani tugas-tugas kompleks, seperti negosiasi bisnis lintas negara, yang melibatkan analisis kontrak, perumusan strategi, dan pengembangan proposal.

Keunggulan Manus terletak pada tiga aspek utama: pemecahan target dinamis, inferensi lintas moda, dan pembelajaran yang ditingkatkan oleh memori. Ini dapat membagi tugas kompleks menjadi ratusan sub-tugas yang dapat dieksekusi, sekaligus menangani berbagai jenis data, dan terus meningkatkan efisiensi pengambilan keputusan serta mengurangi tingkat kesalahan melalui pembelajaran penguatan.

Perkembangan ini sekali lagi memicu diskusi di industri tentang jalur pengembangan AI: Apakah masa depan menuju kecerdasan buatan umum (AGI) atau sistem multi-agen (MAS)?

Konsep desain Manus mengisyaratkan dua kemungkinan:

  1. Jalur AGI: Meningkatkan kemampuan sistem kecerdasan tunggal secara terus-menerus sehingga secara bertahap mendekati tingkat pengambilan keputusan komprehensif manusia.

  2. Jalur MAS: Menetapkan Manus sebagai koordinator utama, mengarahkan ribuan agen ahli untuk bekerja sama.

Kedua jalur ini mencerminkan sebuah kontradiksi inti dalam perkembangan AI: bagaimana menyeimbangkan efisiensi dan keamanan? Sistem kecerdasan tunggal semakin mendekati AGI, semakin sulit untuk menjelaskan proses pengambilan keputusannya; sementara sistem multi-agen dapat mendistribusikan risiko, tetapi mungkin melewatkan momen pengambilan keputusan yang kritis karena keterlambatan komunikasi.

Manus membawa cahaya awal AGI, keamanan AI juga layak untuk dipikirkan

Kemajuan Manus juga memperbesar risiko potensial dalam perkembangan AI. Misalnya, dalam konteks medis, mungkin perlu mengakses data genetik sensitif pasien; dalam negosiasi keuangan, mungkin terpapar informasi keuangan perusahaan yang tidak dipublikasikan. Selain itu, ada masalah bias algoritma, seperti memberikan saran gaji yang tidak adil kepada kelompok tertentu selama proses perekrutan. Dalam hal peninjauan kontrak hukum, mungkin ada tingkat kesalahan yang tinggi pada ketentuan industri yang baru muncul. Yang lebih serius, peretas mungkin dapat mengganggu penilaian Manus dalam negosiasi dengan menyuntikkan sinyal audio tertentu.

Tantangan ini menyoroti kenyataan yang serius: semakin cerdas sistem AI, semakin luas potensi permukaan serangannya.

Dalam bidang Web3, keamanan selalu menjadi topik yang sangat diperhatikan. Teori "trinitas yang tidak mungkin" yang diajukan oleh pendiri Ethereum, Vitalik Buterin (jaringan blockchain tidak dapat secara bersamaan mencapai keamanan, desentralisasi, dan skalabilitas) telah melahirkan berbagai teknologi kripto:

  1. Model keamanan zero trust: menekankan pada verifikasi dan otorisasi identitas yang ketat untuk setiap permintaan akses.

  2. Identitas Terdesentralisasi (DID): memungkinkan entitas untuk mendapatkan identitas yang dapat diverifikasi tanpa pendaftaran terpusat.

  3. Enkripsi Homomorfik Penuh (FHE): memungkinkan perhitungan data dalam keadaan terenkripsi, melindungi privasi data.

Di antaranya, enkripsi homomorfik sepenuhnya dianggap sebagai teknologi kunci untuk mengatasi masalah keamanan di era AI. Ini dapat berperan dalam beberapa aspek berikut:

  • Lapisan data: Semua informasi yang dimasukkan pengguna diproses dalam keadaan terenkripsi, bahkan sistem AI itu sendiri tidak dapat mendekripsi data asli.

  • Aspek algoritma: Mewujudkan "pelatihan model terenkripsi" melalui FHE, bahkan pengembang pun tidak dapat mengintip proses pengambilan keputusan AI.

  • Tingkat kolaborasi: Komunikasi antar beberapa agen cerdas menggunakan enkripsi ambang, sehingga bahkan jika satu node diretas, tidak akan mengakibatkan kebocoran data global.

Di bidang keamanan Web3, sudah ada beberapa proyek yang dieksplorasi. Misalnya, uPort diluncurkan pada tahun 2017 di jaringan utama Ethereum, merupakan salah satu proyek identitas terdesentralisasi yang lebih awal. NKN meluncurkan jaringan utamanya yang berbasis model keamanan zero trust pada tahun 2019. Sedangkan di bidang FHE, Mind Network adalah proyek pertama yang meluncurkan jaringan utamanya dan telah menjalin kemitraan dengan beberapa institusi terkenal.

Dengan perkembangan teknologi AI yang cepat, membangun sistem pertahanan keamanan yang kuat menjadi semakin penting. Enkripsi homomorfik penuh tidak hanya dapat menyelesaikan masalah keamanan saat ini, tetapi juga mempersiapkan kedatangan era AI yang kuat di masa depan. Dalam perjalanan menuju AGI, FHE telah menjadi dukungan teknologi yang tidak terpisahkan.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 4
  • Bagikan
Komentar
0/400
LightningSentryvip
· 16jam yang lalu
Menarik, kinerjanya baik.
Lihat AsliBalas0
BearMarketBarbervip
· 16jam yang lalu
Jalan depan kabur dan beragam
Lihat AsliBalas0
EntryPositionAnalystvip
· 16jam yang lalu
Klasik belum tentu berkelanjutan
Lihat AsliBalas0
WalletDivorcervip
· 16jam yang lalu
Kembali menang ya
Lihat AsliBalas0
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)