Please wait...
SOLUTIONS CORNER
การประมวลผลภาษาธรรมชาติคืออะไร

การประมวลผลภาษาธรรมชาติคืออะไร? (Natural language processing)



การสร้างระบบที่มีความสามารถในการสนทนาที่มีความหมายสมบูรณ์ เป็นหนึ่งในงานที่ยากที่สุดที่นักวิจัยปัญญาประดิษฐ์ (AI) ต้องเผชิญ

หากคุณพบว่าตัวเองกำลังติดต่อกับแผนกบริการลูกค้าอยู่เป็นประจำ คุณอาจจะสังเกตได้ว่าการบันทึกเสียงแบบเดิมนั้นช้ามาก ถึงแม้การให้กดเลข 1 สำหรับคำแนะนำ อาจทำให้การใช้งานง่ายขึ้นเพียงเล็กน้อย
วิธีการบริการที่ทันสมัยนี้มีระบบอัตโนมัติที่สามารถรับฟังและทำความเข้าใจกับการป้อนข้อมูลด้วยเสียงได้ ในอีกแง่คือ เมื่อลูกค้ามีปัญหาหรือมีเรื่องสอบถาม คอมพิวเตอร์สามารถแก้ไขปัญหานั้นได้

ต้องขอบคุณการพัฒนาล่าสุด ในการเรียนรู้ของเครื่องจักร(Machine learning) เพราะเทคโนโลยีนี้มีความซับซ้อนเกินกว่าที่คนส่วนใหญ่เชื่อว่าจะสามารถมีได้ โดยเฉพาะอย่างยิ่งเมื่อประสบการณ์ของเราเกี่ยวกับเรื่องนี้มักจะข้อจำกัดการโต้ตอบกับAmazon Echo การประมวลผลภาษาธรรมชาติเป็นเฟรมเวิร์กที่อุปกรณ์ดังกล่าวสร้างขึ้น เพื่อรับผิดชอบในส่วนของนวัตกรรมใหม่ๆมากมายรวมถึง ‘แชทบอท’ ที่มีความสามารถตรวจสอบ สืบค้น ตอบสนอง หรือการวิเคราะห์เนื้อหาในข้อมูลเชิงบริบท และในอีกหลายกรณีที่สามารถประเมินอารมณ์ของคุณได้

ไม่ว่าคุณจะถามลำโพงอัจฉริยะว่า สภาพอากาศจะเป็นอย่างไรในสัปดาห์นี้โทรตรวจสอบเวลารถไฟขบวนล่าสุด หรือโทรไปร้องเรียนเกี่ยวกับประสบการณ์การใช้งานที่แย่  การประมวลผลภาษาธรรมชาติ (NLP) จะคอยทำงานอยู่เบื้องหลังเพื่อให้บริการนั้นออกมาดีที่สุด อย่างน้อยก็ให้ได้ผลใกล้เคียงกับการได้รับบริการจากมนุษย์

ไม่ใช่แค่การใช้งานด้วยเสียงเท่านั้นที่การประมวลผลภาษาธรรมชาติ (NLP) สามารถทำได้ แต่มันยังสามารถช่วยในเรื่องของซอฟต์แวร์ประมวลผลคำศัพท์ ในการตรวจสอบข้อผิดพลาดทางไวยากรณ์ ซึ่งมันอยู่ในเบื้องหลังของกูเกิลแปลภาษา(Google Translate)เช่นกัน โดยมันจะทำหน้าที่ในการแปลเพื่อให้แน่ใจว่าเอกสารในภาษาที่คุณอ่านไม่ออก จะถูกนำไปใช้ในภาษาที่คุณสามารถอ่านได้ นอกจากนี้ยังช่วยให้แชทบอทบนธนาคารที่คุณใช้ เข้าใจและปฏิบัติตามคำขอของคุณได้ทันที


การแก้ปัญหาที่ซับซ้อน

อย่างไรก็ตามการมีบทสนทนาที่มีประสิทธิภาพหรือการอ่านข้อความนั้นเต็มไปด้วยความแตกต่าง ข้อสรุปและการตัดสิน และมันเป็นสิ่งหนึ่งที่แยกภาษาออกเป็นคำนาม คำกริยา คำคุณศัพท์และอื่นๆ แต่การจัดโครงสร้างประโยคของภาษานั้นมีกลไกที่หลากหลายและซับซ้อน  ซึ่งความซับซ้อนนี้นี่แหละที่เพิ่มเข้ามาทำให้คอมพิวเตอร์ตีความและเลียนแบบปฏิสัมพันธ์ของมนุษย์ได้ยาก

คำหนึ่งคำสามารถตีความหมายได้หลายแบบ ขึ้นอยู่ว่าใช้ในบริบทไหน ลองพิจารณาตัวอย่างเช่น ‘เครื่องบินพุ่งไปทางซ้าย’(The aeroplane banked to the left) กับ ‘ฉันฝากเช็คที่คุณให้มา’ (I banked the cheque you gave me) หรืออีกตัวอย่างคือ ‘ฉันยืนอยู่ที่หัวเรือของเรือ’ (I stood at the bow of the ship) กับ ‘มาร์คผูกเชือกผูกรองเท้าของเขาไว้ในธนู’(Mark tied his shoelaces into a bow) ซึ่งนี่ไม่ได้กล่าวถึงการโค้งคำนับต่อผู้ชม (The act of bowing to an audience)หรืออุปกรณ์ที่ใช้ยิงธนู (The device used to shoot an arrow)

เราจะรู้ว่าการใช้คำว่า ‘bow’ ในแต่ละประโยคนั้นจะขึ้นอยู่กับบริบทของคำที่อยู่รอบๆ แต่บางครั้งบริบทและคำโดยรอบก็ไม่ได้ช่วยอะไรเช่นกัน ตัวอย่างเช่น ลองพิจารณาประโยคที่ว่า “ฉันเห็นคนเดินป่าบนทางเดินกับกล้องส่องทางไกล” (I saw the hiker on the path with binoculars) ใครมีกล้องส่องทางไกล  ฉันหรือคนเดินป่า?

ภาษาอังกฤษเป็นภาษาที่ขึ้นอยู่กับบริบทเป็นหลัก ซึ่งคนที่ไม่ใช่เจ้าของภาษามักจะมีปัญหาในการใช้ และเข้าใจภาษาอังกฤษเสมอ  และนั้นก็ยังไม่รวมถึงความแตกต่างในการพูดของแต่ละบุคคลด้วย อย่างเช่น การประชดเสียดสีและอารมณ์ขัน ซึ่งแม้แต่มนุษย์ด้วยกันเองก็ยังยากที่จะเข้าใจ และหาข้อสรุปได้จากเพียงประโยคๆเดียว
 

ซอลฟ์แวร์การประมวลผลภาษาธรรมชาติทำอะไรได้บ้าง?

การประมวลผลภาษาธรรมชาติ ช่วยให้เราแก้ปัญหาต่างๆที่เกี่ยวข้องกับการทำความเข้าใจของภาษาพูดโดยการรวบรวมข้อมูลและอัลกอริทึม(Algorithms)เพื่อสร้างเป็นบริบทขึ้นมา โดยที่มีสองประเด็นหลักในการทำงานนี้ คือ วากยสัมพันธ์และอรรถศาสตร์

วากยสัมพันธ์เป็นวิธีที่ง่ายที่สุดถ้าเทียบกับอรรถศาสตร์ เนื่องจากมันมีกฎที่ได้กำหนดไว้อย่างชัดเจนแล้ว รวมไปถึงมีคำจำกัดความตามพจนานุกรม โครงสร้างของประโยค และที่สำคัญที่สุดคือวจีวิภาค ซึ่งมันเกี่ยวข้องกับการทำความเข้าใจว่าความหมายของประโยคที่แท้จริงคืออย่างไร อย่างตัวอย่างที่ได้กล่าวไปในข้างต้นของ ‘binocular’ วจีวิภาคจะช่วยในการระบุว่าพวกเขาเป็นใคร โดยการวิเคราะห์จากประโยคก่อนหน้าหรือประโยคต่อมา

ด้วยการประมวลผลภาษาธรรมชาติ อัลกอริทึม (Algorithms) ยังสามารถใช้เทคนิคของการประมวลผลวากยสัมพันธ์ต่างๆได้ เพื่อนำมาช่วยในแบ่งกฎต่างๆออก สิ่งเหล่านี้รวมไปถึง ‘การแบ่งคำ’ ซึ่งจะแยกข้อความขนาดใหญ่ออกเป็นส่วนต่างๆ ‘การกั้น’ ซึ่งเกี่ยวกับการปรับปรุงคำที่ผันไปยังรูปแบบของรากศัพท์ และการแบ่งส่วนทางสัณฐานวิทยา ซึ่งใช้ในการแบ่งคำให้เป็นหน่วยที่เล็กและมีความหมายดีที่สุด เช่น ‘in’, ‘come’, ‘-ing’ ของคำว่า 'incoming'

ถึงแม้ว่าอรรถศาสตร์จะมีโครงสร้างที่น้อยกว่าและยากที่จะตีความ แต่ในอีกแง่มันก็เกี่ยวข้องกับการทำความเข้าใจความหมายของคำในแต่ละคำในบริบทที่กว้างขึ้นของประโยค เช่นเดียวกับตัวอย่างข้างต้น ก็คือการเข้าใจถึงการใช้คำว่า ‘bow’ ที่หลากหลายและเหมาะสมที่สุด

อรรถศาสตร์ยังรวมไปถึง ‘การระบุชื่อ’ ซึ่งเกี่ยวกับการหาว่าส่วนใดของข้อความนั้นเกี่ยวข้องกับชื่อมากที่สุด หลังจากนั้นจะทำการกำหนดประเภทของชื่อว่าเป็นชื่อของบุคคลหรือชื่อของสถานที่ โดยระบบสามารถประมวลผลได้จากการใช้อักษรตัวแรกในการระบุชื่อได้ แต่บางครั้งตัวอักษรตัวแรกของประโยคหรือชื่อขององค์กรจำนวนมากก็ไม่ได้ใช้ประโยชน์ตัวอักษรทุกตัว และกฎการใช้อักษรตัวพิมพ์ใหญ่ในแต่ละภาษาก็ไม่เหมือนกัน อย่างเช่น ในภาษาเยอรมัน คำนามทุกคำจะเป็นตัวพิมพ์ใหญ่

ซึ่งนี่คือการวิเคราะห์เชิงความหมายของอรรถศาสตร์โดยทั่วไป  ถึงแม้บางเทคนิคยังสามารถใช้ได้ แต่ก็ยังมีอุปสรรค์อีกหลายอย่างที่อรรถศาสตร์ยังไม่สามารถแก้ได้
 

พวกเราจะไปถึงจุดนั้นกันรึยัง?

เนื่องจากธรรมชาติของภาษามนุษย์มีวิวัฒนาการมานานนับพันปี ระบบคอมพิวเตอร์จึงจำเป็นที่จะต้องมีความยืดหยุ่น มีความสามารถในการรองรับ และสามารถคาดเดาการศึกษาได้

ระบบที่อยู่บนพื้นฐานของการประมวลผลภาษาธรรมชาติยังคงได้รับการพัฒนาอย่างต่อเนื่องและมีเพียงโมเดลขั้นพื้นฐานเท่านั้นที่เปิดให้ใช้กันอย่างแพร่หลาย ผู้ช่วยอัจฉริยะอย่าง Siri, Alexa และ Google Home เป็นเพียงแค่ผู้ช่วยในตั้งคำถามและคำตอบ แต่ยังไม่สามารถทำการสนทนาได้
Apple, Amazon, Google, IBM และผู้เล่นเทคโนโลยีที่สำคัญอื่น ๆ กำลังทำงานกับระบบ NLPของตัวเองเพื่อรับมือกับความท้าทายที่หลากหลาย สิ่งเหล่านี้ยังรวมไปถึงระบบที่สามารถทำการวิเคราะห์ข้อความจำนวนมากได้ในเอกสาร การประเมินอีเมลเพื่อช่วยในการคัดกรองอีเมลขยะ และเพื่อรักษาการสื่อสารซึ่งเป็นส่วนหนึ่งของเครื่องมือที่ใช้ในการบริการลูกค้า
ความซับซ้อนของแชทบอทออนไลน์ (Online chatbot) นั้นมีการปรับปรุงอยู่ตลอดเวลา แต่ถึงอย่างนั้นมันก็สามารถทำได้เพียงตอบคำถามแบบง่าย ๆ และผู้ใช้ก็จำเป็นต้องระบุคำที่ชัดเจนให้มัน การร้องเรียนมักจะโดนโอนถ่ายไปยังพนักงานเมื่อปัญหานั้นมีความเหมาะสมเพียงพอ โดยที่ลูกค้าไม่จำเป็นต้องทำอะไรมาก

พวกเรายังคงห่างไกลกับการปฏิสัมพันธ์ที่ไร้รอยในเรื่องของอุตสาหกรรมการบริการลูกค้าอยู่มาก

ควิกเซิร์ฟ
สินค้า
งานระบบ
บริการ
กิจกรรม
ออนไลน์