Perbandingan Model Penalaran ChatGPT o3-mini dengan DeepSeek-R1: Hasilnya Mengejutkan!

Pekan ini menjadi sangat menarik bagi dunia kecerdasan buatan dengan hadirnya model penalaran R1 dari DeepSeek yang secara drastis mengguncang pasar AI. Model ini tidak hanya tersedia secara gratis sebagai chatbot, tetapi juga memberikan akses API yang sangat terjangkau bagi pengembang. Namun, DeepSeek sempat mengalami serangan siber yang membuatnya tidak dapat diakses sementara waktu, meskipun sekarang sudah kembali beroperasi.

Sebagai tanggapan, OpenAI merilis model penalaran o3-mini dan o3-mini-high yang tersedia di semua layanan berlangganan mereka, termasuk langganan Plus, Pro, dan juga tier gratis. Untuk menggunakan o3-mini di tier gratis ChatGPT, baik di perangkat mobile maupun web, Anda hanya perlu memperbarui aplikasi ChatGPT dan mengetuk tombol "Reason" yang baru di samping kotak pesan. Fitur ini sama persis di versi peramban web ChatGPT.

Model penalaran sangat unggul dalam tugas-tugas seperti menulis kode kompleks dan menyelesaikan masalah matematika yang sulit. Namun, kebanyakan dari kita menggunakan chatbot untuk mendapatkan jawaban cepat atas pertanyaan sehari-hari. Oleh karena itu, saya penasaran bagaimana kinerja model penalaran baru o3-mini dibandingkan dengan DeepSeek-R1, mengingat keduanya dapat diakses secara gratis.

Uji Pertama: Nasihat Hidup

Pertama, saya meminta o3-mini untuk memberikan nasihat hidup dan membantu saya (berpura-pura saya berusia 18 tahun lagi) memilih antara memulai karir atau melanjutkan pendidikan ke universitas. Pertanyaan semacam ini memerlukan banyak pertimbangan, jadi saya pikir ini adalah awal yang baik.

Kedua model memberikan jawaban yang layak, tetapi perbedaan dalam penyajiannya cukup mengejutkan. ChatGPT o3-mini berpikir sejenak dan memberikan wawasan singkat tentang proses berpikirnya, seperti "Saya sedang mempertimbangkan keputusan antara memulai karir sekarang atau melanjutkan pendidikan. Perlu mengumpulkan lebih banyak detail, seperti tujuan dan keadaan spesifik, sebelum memberikan nasihat." dan "Saya sedang mengevaluasi persyaratan bidang, mempertimbangkan minat, preferensi, keuangan, tujuan karir, dan pasar kerja. Bimbingan dan penelitian sangat penting. Konteks pribadi juga krusial untuk keputusan yang tepat."

Di sisi lain, DeepSeek benar-benar mengungkap proses penalarannya secara detail, memberikan informasi tentang setiap titik yang dipertimbangkan. Bahkan, terkadang terasa terlalu banyak informasi! Misalnya, DeepSeek berpikir, "Tunggu, tapi bagaimana saya tahu apa yang saya inginkan? Mungkin saya harus membuat daftar pro dan kontra." dan kemudian mempertimbangkan, "Bagaimana dengan passion? Apakah saya bersemangat tentang bidang studi tertentu, atau saya lebih ingin masuk ke dunia kerja? Jika saya tidak yakin apa yang ingin saya pelajari, mungkin bekerja dulu bisa membantu saya sebelum memutuskan untuk mengambil gelar."

Kesimpulan

Kedua model memberikan jawaban akhir yang terstruktur dengan poin-poin dan kategori, sebelum menyajikan ringkasan. Inilah cara model penalaran mendalam memberikan jawaban mereka, berbeda dengan ChatGPT 4o yang memberikan jawaban lebih ringkas.

Secara umum, ChatGPT o3-mini lebih ringkas dalam menunjukkan penalarannya, sementara DeepSeek-R1 lebih luas dan verbose. Jika Anda benar-benar perlu melihat cara LLM sampai pada jawaban, pendekatan DeepSeek-R1 terasa seperti mendapatkan layanan penalaran lengkap, sementara ChatGPT o3-mini lebih seperti ikhtisar.

Meski demikian, laporan menunjukkan bahwa o3-mini dapat mengalahkan DeepSeek-R1 dalam hal simulasi fisika dan tantangan geometris kompleks. Namun, untuk hal-hal sederhana, saya lebih suka DeepSeek-R1.

Share:

0 Comments:

Post a Comment