Bangkok Ipsum เป็นเว็บที่สามารถสร้างข้อความภาษาไทยมั่วๆ เพื่อใช้เป็นเนื้อหาจำลองสำหรับงานออกแบบและงานพิมพ์ (คล้ายๆ กับพวก Lorem Ipsum ของฝรั่ง) โดยโมเดลปัญญาประดิษฐ์ของเว็บ Bangkok Ipsum ได้ทำการเทรนข้อมูลจากเนื้อเพลงของวงไอดอล 2 วง ที่ผลรวมของเลขท้ายชื่อวงเท่ากับ 64
เว็บนี้ทำงานโดยการวิเคราะห์ข้อความที่สร้างขึ้นมาก่อนหน้า แล้วคาดเดาว่าจะต่อด้วยคำไหนดี ทำซ้ำๆ จนได้ความยาวที่ต้องการ (คล้ายๆ เวลาที่เราใช้คีย์บอร์ดบนมือถือ แล้วมันช่วยเดาคำต่อไปได้เพื่อให้พิมพ์สะดวกขึ้น) โดยใช้สิ่งที่เรียกว่า “n-gram model”
สมมุติว่าเริ่มต้นด้วยข้อความว่า “แอบมองเธอ”
ในโมเดลนี้เก็บข้อมูลว่าคำต่อไปสามารถเป็นคำอะไรได้บ้าง ตามตารางนี้:
เรานำข้อมูลนี้มาใช้เพื่อคำนวณความน่าจะเป็นที่จะเลือกคำต่อไป
หลังจากนั้นจึงเลือกโดยการสุ่มถ่วงน้ำหนัก
สมมติว่าสุ่มได้คำว่า “นั้น”
เราก็จะเอาข้อความ “แอบมองเธอนั้น” มาใช้ในการเลือกคำถัดไป
ทำแบบนี้ไปเรื่อยๆ จนได้ประโยคความยาวที่ต้องการ
แอบมองเธอนั้นคำต่อไป:
เมื่อนำข้อความที่สร้างขึ้นได้มาวิเคราะห์ดู
จะพบว่า ข้อความนี้สร้างจากชิ้นส่วนเนื้อเพลงวง BNK48 หลายๆ เพลงมาต่อกัน
คล้ายๆ กับเล่นเกมต่อเพลง
จึงได้เป็นข้อความภาษาไทยที่ดูเหมือนจะมีความหมาย แต่ก็ไม่มีความหมายใดๆ ทั้งสิ้น
สามารถดู Source Code ของเว็บนี้ได้บน GitHub ที่
https://github.com/dtinth/bangkokipsum