เกี่ยวกับ Bangkok Ipsum

Bangkok Ipsum เป็นเว็บที่สามารถสร้างข้อความภาษาไทยมั่วๆ เพื่อใช้เป็นเนื้อหาจำลองสำหรับงานออกแบบและงานพิมพ์ (คล้ายๆ กับพวก Lorem Ipsum ของฝรั่ง) โดยโมเดลปัญญาประดิษฐ์ของเว็บ Bangkok Ipsum ได้ทำการเทรนข้อมูลจากเนื้อเพลงของวงไอดอล 2 วง ที่ผลรวมของเลขท้ายชื่อวงเท่ากับ 64

เว็บนี้สร้างข้อความได้อย่างไร

เว็บนี้ทำงานโดยการวิเคราะห์ข้อความที่สร้างขึ้นมาก่อนหน้า แล้วคาดเดาว่าจะต่อด้วยคำไหนดี ทำซ้ำๆ จนได้ความยาวที่ต้องการ (คล้ายๆ เวลาที่เราใช้คีย์บอร์ดบนมือถือ แล้วมันช่วยเดาคำต่อไปได้เพื่อให้พิมพ์สะดวกขึ้น) โดยใช้สิ่งที่เรียกว่า “n-gram model”

สมมุติว่าเริ่มต้นด้วยข้อความว่า “แอบมองเธอ”
ในโมเดลนี้เก็บข้อมูลว่าคำต่อไปสามารถเป็นคำอะไรได้บ้าง ตามตารางนี้:

ตัวอย่างตารางแสดงตัวเลือกสำหรับการเลือกคำถัดไป กรณีที่ 3 คำก่อนหน้า คือ “แอบมองเธอ”

เรานำข้อมูลนี้มาใช้เพื่อคำนวณความน่าจะเป็นที่จะเลือกคำต่อไป
หลังจากนั้นจึงเลือกโดยการสุ่มถ่วงน้ำหนัก

ความน่าจะเป็นในการเลือกคำถัดไป กรณีที่ 3 คำก่อนหน้า คือ “แอบมองเธอ”

สมมติว่าสุ่มได้คำว่า “นั้น”
เราก็จะเอาข้อความ “แอบมองเธอนั้น” มาใช้ในการเลือกคำถัดไป
ทำแบบนี้ไปเรื่อยๆ จนได้ประโยคความยาวที่ต้องการ

แอบมองเธอนั้น
คำต่อไป:

เมื่อนำข้อความที่สร้างขึ้นได้มาวิเคราะห์ดู
จะพบว่า ข้อความนี้สร้างจากชิ้นส่วนเนื้อเพลงวง BNK48 หลายๆ เพลงมาต่อกัน
คล้ายๆ กับเล่นเกมต่อเพลง

จึงได้เป็นข้อความภาษาไทยที่ดูเหมือนจะมีความหมาย แต่ก็ไม่มีความหมายใดๆ ทั้งสิ้น

โค้ด

สามารถดู Source Code ของเว็บนี้ได้บน GitHub ที่
https://github.com/dtinth/bangkokipsum