Sistem Dialog Bagian 2: Bagaimana Mengembangkan Sistem Dialog yang Masuk Akal – Majalah Time.com

  • Whatsapp


Ada sedikit argumen bahwa sistem dialog adalah salah satu aplikasi sadar bahasa yang sedang booming akhir-akhir ini. Interaksi bahasa alami dengan cepat menjadi bagian penting dari kehidupan sehari-hari manusia dengan memungkinkan kita mengakses sumber daya komputasi dan terlibat dalam komunikasi dengan cara yang sangat intuitif.

Bacaan Lainnya

Di dalam Bagian 1 dari seri ini diterbitkan di sini pada teknologi.org, kami menyajikan sistem dialog dari perspektif bisnis. Di bagian ini, kita akan mulai melihat apa yang membuat pikiran orang-orang R&D masa kini sibuk dalam upaya mereka untuk menghadirkan sistem dialog yang benar-benar interaktif dan efisien. Anda juga akan diperkenalkan dengan pipa NLP umum untuk membangun sistem dialog.

Sistem Dialog dari Perspektif Peneliti

Ada beberapa alasan mengapa Anda ingin membangun sistem dialog:

  • Untuk menyediakan akses penghalang rendah bagi pengguna, memungkinkan mereka untuk berkomunikasi secara intuitif dengan layanan, sumber daya, dan data di internet. Dengan sistem dialog, tidak perlu menguasai antarmuka—setidaknya secara teori. Anda dapat mengatakan apa pun yang Anda inginkan dan asisten seharusnya mendukung dan menghibur Anda sebagai pendamping sosial. Jika interaksi ini terjadi dalam pengaturan komersial, asisten harus memberikan layanan mandiri dan bantuan otomatis kepada pelanggan.
  • Untuk memenuhi tantangan membangun model komputasi untuk kemampuan percakapan manusia. Mampu berbicara secara alami, memberikan tanggapan yang tepat, dan memahami keadaan emosi pasangan adalah salah satu keterampilan mental tingkat atas yang memfasilitasi interaksi sosial.
  • Untuk meniru kinerja percakapan manusia sehingga sistem dialognya menyerupai berbicara dengan manusia. Lulus tes Turing, bagaimanapun, bukanlah kondisi vital ketika menerapkan sistem dialog yang benar-benar efektif. Sebaliknya, terkadang pengguna mungkin merasa canggung dengan sistem dialog yang mampu menipu mereka agar percaya bahwa mereka sedang berbicara dengan manusia. Oleh karena itu, seseorang harus berhati-hati dengan pendekatan ini dan mengupayakan keseimbangan yang tepat untuk memenuhi masalah etika.

Sistem Dialog dari Perspektif Pengembang

Sistem Dialog dari Perspektif Pengembang

Kredit gambar: Pexels, lisensi gratis

Ada tiga pendekatan utama untuk pembangunan sistem dialog: berbasis aturan, data-driven statistik, dan sepenuhnya saraf. Dalam aliran percakapan sistem berbasis aturan dan aspek antarmuka lainnya dibuat dengan tangan menggunakan pedoman praktik terbaik yang telah diusulkan oleh perancang antarmuka pengguna suara selama beberapa dekade terakhir. Ini berisi pedoman tentang komponen komunikasi seperti:

  • bagaimana merancang prompt yang efektif;
  • bagaimana terdengar alami;
  • bagaimana bertindak secara kooperatif;
  • bagaimana mengajukan bantuan setiap saat;
  • bagaimana mencegah kesalahan; dan
  • bagaimana memulihkan dari kesalahan ketika terjadi.

Ada juga pedoman tingkat yang lebih tinggi, misalnya:

  • bagaimana mendukung keterlibatan dan retensi;
  • bagaimana membuat pengalaman pelanggan lebih istimewa dan menyenangkan; dan
  • penggunaan persona dan branding.

Beberapa pedoman ini membahas aspek linguistik komunikasi seperti mempertahankan konteks dalam wacana multi-turn, mengajukan pertanyaan tindak lanjut, dan mempertahankan dan berbagai topik. Lainnya lebih terkait dengan kompetensi sosial seperti mendukung keterlibatan, menunjukkan kepribadian, dan menyampaikan dan memahami emosi. Terakhir, ada faktor psikologis seperti mampu memahami keyakinan dan niat mitra dialog. Semua faktor ini sangat penting bagi agen percakapan untuk menjadi produktif serta menarik bagi pengguna.

Dalam pendekatan berbasis data statistik dan sepenuhnya saraf, strategi percakapan dikuasai dari data. Sistem dialog berbasis data statistik muncul pada akhir 1990-an dan sistem dialog berbasis pembelajaran mendalam sepenuhnya saraf pertama kali muncul sekitar tahun 2014.

Jika Anda tertarik untuk mempelajari lebih banyak hal teknis tentang ketiga pendekatan ini, kembalilah untuk artikel lanjutan kami tentang Sistem Dialog di teknologi.org!

Pipa NLP Sistem Dialog

Sistem dialog membutuhkan empat jenis pemrosesan bersama dengan database untuk menyimpan pernyataan dan tanggapan sebelumnya. Masing-masing dari empat tahap pemrosesan dapat melibatkan satu atau lebih algoritma pemrosesan yang berjalan secara paralel atau seri:

  • Penguraian—Mengonversi pernyataan dalam bahasa alami menjadi data numerik terstruktur (fitur) melalui beberapa langkah prapemrosesan termasuk tokenisasi, penandaan bagian-of-speech, pengenalan entitas bernama, dan vektorisasi. Pada tahap ini, kami mendapatkan sistem dialog “mendengarkan” Anda dengan menerjemahkan bahasa manusia ke dalam jargon komputer.
  • Menganalisa—Menggabungkan fitur untuk mengevaluasi tata bahasa, sentimen, dan semantik masukan Anda. Sekarang sistem menafsirkan apa yang baru saja Anda katakan.
  • Menghasilkan—Mempekerjakan template, model bahasa dan pencarian untuk menghasilkan kemungkinan tanggapan dari sistem dialog. Pada tahap ini, kami mengajarkan sistem untuk berbicara “bahasa manusia”.
  • Pelaksana—Memilih urutan tanggapan sesuai dengan riwayat dan tujuan percakapan. Ini adalah tahap manajemen di mana rencana harus dibuat tanggapan apa yang harus mengikuti yang sebelumnya untuk mempertahankan percakapan yang “masuk akal” bagi Anda.

Pipa NLP berulang dari sistem dialog. Gambar dari: [Hobson Lane, Cole Howard, and Hannes Max Hapke. Natural Language Processing in Action. Manning Publications, 2019]

Sebagian besar sistem dialog akan mencakup aspek keempat tahap pemrosesan yang ditunjukkan sebagai kotak warna bernomor pada gambar di atas. Namun, banyak aplikasi hanya membutuhkan algoritme langsung untuk beberapa langkah ini. Beberapa sistem dialog lebih cocok untuk menjawab pertanyaan faktual, sementara yang lain akan unggul dalam menghasilkan respons yang diperluas dan agak canggih yang bahkan mungkin meyakinkan Anda tentang mengobrol dengan manusia. Masing-masing kapasitas ini membutuhkan pendekatan yang berbeda; kami berharap dapat mengungkapnya kepada Anda dalam seri Sistem Dialog ini.

Singkatnya, seri ini akan tentang menggunakan pembelajaran mesin untuk menyelamatkan Anda dari keharusan memprediksi semua skenario yang mungkin diikuti manusia saat mengomunikasikan berbagai hal dalam bahasa alami. Dengan setiap bagian dari seri, Anda secara bertahap akan membangun pemahaman yang lebih baik tentang item dasar dalam pipa NLP untuk sistem dialog. Saat Anda menguasai alat NLP, pada akhirnya Anda akan mengetahui cara mengatur saluran Anda sendiri untuk mendukung percakapan seperti manusia dengan mesin seperti yang Anda inginkan.

Terakhir, jangan khawatir jika Anda melihat banyak istilah dalam diagram blok di atas yang mungkin terlihat membingungkan atau tidak masuk akal bagi Anda. Dan kami bahkan tidak akan mencoba menjelaskan sebagian besar istilah ini di bagian selanjutnya dari seri ini. Itu hampir tidak mungkin, jujur ​​saja. Namun, jika Anda siap untuk menunjukkan kegigihan, kami akan mencoba menjelaskan dalam bahasa sederhana – perlahan, selangkah demi selangkah – apa yang tersembunyi di balik semua kotak warna di sana. Teruskan membaca artikel seri di teknologi.org, dan Anda tidak akan menyesal!

Bagaimana dengan masa depan?

Potensi apa yang harus dimiliki sistem dialog masa depan untuk memungkinkan mereka membenamkan diri ke dalam dialog yang benar-benar mirip manusia? Salah satu cara untuk menjawabnya adalah dengan menjelajahi video Apple Knowledge Navigator yang ditunjukkan di bawah ini, yang dipresentasikan pada tahun 1987 oleh Apple. Video itu diusulkan sebagai visi tentang apa yang akan dicapai suatu hari nanti.

Dalam video tersebut seorang profesor universitas kembali ke rumah dan menyalakan komputernya untuk disambut oleh Personal Digital Assistant (PDA). PDA muncul di layar dan memberi tahu profesor bahwa dia memiliki beberapa pesan dan beberapa acara di kalendernya. Profesor terlibat dalam dialog dengan PDA untuk mengumpulkan data untuk kuliah yang akan datang.

Beberapa kemampuan PDA nyata saat ini, misalnya, pelaporan tentang pesan, panggilan tidak terjawab, dan acara kalender yang akan segera terjadi. Profesor meminta PDA untuk menampilkan beberapa gambar, misalnya, hanya tampilkan universitas dengan simpul geografi. Pencarian suara untuk data tekstual dan visual juga dapat dilakukan dengan sistem dialog modern pada smartphone dan speaker pintar dengan tampilan visual.

Periksa, bagaimanapun, percakapan ini di mana profesor (PROF) bertanya kepada PDA untuk data tertentu untuk kuliahnya [McTear, 2021]:

PDA1: Anda memiliki kuliah di 4.15 tentang deforestasi di hutan hujan Amazon.

PROF1: Coba saya lihat catatan kuliah dari semester lalu.

PDA mengambil catatan kuliah dan menampilkannya.

PROF2: Tidak, itu tidak cukup.

PROF3: Saya perlu meninjau literatur yang lebih baru.

PROF4: Tarik semua artikel baru yang belum saya baca.

PDA2: Artikel jurnal saja?

PROF5: Mm-hm.

PDA3: Teman Anda Jill Gilbert telah menerbitkan artikel tentang deforestasi di Amazon

dan pengaruhnya terhadap curah hujan di sub-Sahara, juga mencakup pengaruh kekeringan terhadap makanan

produksi di Afrika dan peningkatan impor makanan.

PROF6: Hubungi Jill.

PDA4: Dia tidak tersedia

Sistem Dialog dari Perspektif Pengguna

Kredit gambar: Pexels, lisensi gratis

Beberapa bagian dari skenario ini dapat dicapai hari ini, seperti meminta untuk menghubungi seseorang (PROF6) dan diberitahu bahwa mereka tidak tersedia (PDA4), juga mendapatkan jenis dokumen tertentu, yaitu,

artikel jurnal, dan membacakan deskripsinya (PDA3). Bagian lain lebih menuntut. Untuk

misalnya, sejak mengambil catatan kuliah dari semester lalu (PROF1) ditentukan hanya sebagian, instruksi ini hanya dapat dirasakan dengan baik jika PDA mengikuti konteks topik kuliah yang akan datang (PDA1). Ungkapan “literatur yang lebih baru” juga rumit karena berkaitan dengan ungkapan “lebih baru” untuk mengambil catatan kuliah yang tanggalnya lebih lambat daripada yang diambil. Terakhir, mengumpulkan artikel yang belum dibaca profesor membutuhkan model pengguna yang melacak apa yang telah dibaca profesor tentang topik ini dan menghapusnya dari daftar artikel saat ini dan baru.

Sebagian besar tantangan ini mempengaruhi bagian Natural Language Understanding (NLU), tidak begitu banyak dalam hal memahami konten yang tepat tetapi lebih dalam hal memahami peristiwa wacana seperti referensi yang tidak ditentukan. Sistem NLU modern menuntut input yang lebih eksplisit, sehingga sistem dapat menemukan item yang diinginkan dalam pencariannya.

Mengingat tantangan-tantangan ini, masih banyak pekerjaan di depan bagi para peneliti untuk mencapai tujuan sistem dialog cerdas tertinggi.

Membungkus

Ini adalah artikel kedua di teknologi.org seri tentang Sistem Dialog, di mana kami menyajikan hal-hal yang paling harus dikonsentrasikan oleh pengembang dan peneliti saat membangun AI percakapan yang berharga hari ini dan juga dalam waktu dekat. Anda juga terbiasa dengan pipa NLP umum yang digunakan dalam proses ini.

Detail teknis dari pipeline akan menjadi fokus di bagian-bagian yang akan datang dari seri ini. Cek terus kami teknologi.org situs untuk kelanjutan!

Biodata Penulis

Darius Miniotas adalah seorang ilmuwan data dan penulis teknis dengan Neurotechnology di Vilnius, Lithuania. Dia juga Associate Professor di VILNIUSTECH di mana dia telah mengajar pemrosesan sinyal analog dan digital. Darius menyandang gelar Ph.D. di Teknik Elektro, tetapi minat penelitian awalnya berfokus pada interaksi manusia-mesin multimodal yang menggabungkan tatapan mata, ucapan, dan sentuhan. Saat ini dia sangat menyukai AI prososial dan percakapan. Di Neurotechnology, Darius sedang mengejar proyek penelitian dan pendidikan yang mencoba untuk mengatasi tantangan yang tersisa dalam berurusan dengan multimodalitas dalam dialog visual dan interaksi multipartai dengan robot sosial.

Referensi

Andrew R.Freed. AI percakapan. Publikasi Manning, 2021.

Rasyid Khan dan Anik Das. Bangun Chatbot yang Lebih Baik. Apres, 2018.

Hobson Lane, Cole Howard, dan Hannes Max Hapke. Pemrosesan Bahasa Alami dalam Tindakan. Publikasi Manning, 2019.

Michael McTear. AI percakapan. Morgan & Claypool, 2021.

Sumit Raj. Membangun Chatbot dengan Python. Apres, 2019.

Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta, dan Harshit Surana. Pemrosesan Bahasa Alami Praktis. O’Reilly Media, 2020.



Pos terkait

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *