แนวคิดของตัวแปรสุ่ม (random variables)

หลายคนที่เคยเรียนเรื่องตัวแปรสุ่ม พอได้ยินคำนี้ก็จะคิดถึงแต่การ integrate ตัว Probability distribution function แต่ไม่ได้เข้าใจว่าหลักการนำไปใช้มันเป็นอย่างไร  จึงไม่เข้าใจว่าจะเรียนไปทำไม  ผมคนนึงเป็นเช่นนั้นในขณะเรียนวิชานี้    ผมจะอธิบายหลักการใช้งานของ Random variables ในบทความนี้จากความเข้าใจของผมเอง  จากนั้นเรื่องเทคนิคมันเป็นแค่รายละเอียด


ตัวแปรสุ่มนั่นก็คือตัวแปรชนิดหนึ่ง  ตัวแปรทั่วไปก็คือยังไม่ได้กำหนดค่า
ตัวแปรทั่วไปสามารถกำหนดค่าได้บนdomain ของตัวแปรนั้นเช่น x เป็นตัวแปรจำนวนจริงระหว่าง0-100  ก็หมายความว่า x ยังไม่รู้ค่า อยู่ระหว่าง 0-100 และเป็นตัวเลขจำนวนจริง    ทีนี้ค่า x จะถูกกำหนดค่าโดยเงื่อนไข(constraints)  เช่น x=22.3  ก็คือเงื่อนไขที่บังคับให้ x = 22.3  หรือเงื่อนไขที่บอกว่า x-22.3=0 ก็คือเงื่อนไขที่ทำให้ x = 22.3   กล่าวคือxถูกบังคับให้มีค่า22.3เพื่อทำให้เงื่อนไขเป็นจริง  เมื่อxถูกรู้ค่า เราเรียกว่า x ถูกกำหนดค่าลงไปแล้ว

ตัวแปรสุ่มก็เหมือนตัวแปรธรรมดา ที่ต่างกันออกไปคือ ตัวแปรสุ่มจะมีอีกสิ่งหนึ่งที่เรียกว่า เหตุการณ์   เมื่อเหตุการ์เกิดขึ้นแล้ว ตัวแปรสุ่มก็จะกลายเป็นตัวแปรธรรมดาที่ถูกกำหนดค่าลงไปแล้ว  แต่ก่อนเหตุการ์ณจะเกิด  ตัวแปรสุ่มอาจจะมีค่าใดๆก็ได้  ยกตัวอย่างเช่น  ให้ตัวแปรสุ่ม gene เป็นยีนส์ที่กำหนดเพศลูก มีค่าที่เป็นไปได้2ค่าคือ ชาย กับ หญิง.  เมื่อตอนที่ยังดูเพศลูกในครรภ์ ตัวแปร gene ก็ยังไม่ถูกกำหนดค่า แต่มีความเป็นไปได้อยู่สองทาง ไม่ชายก็หญิง  เมื่อคลอดออกมาเห็นอวัยวเพศลูก ก็สามารถกำหนดค่าได้ว่าเป็นชาย หรือ หญิง  พอหลังเหตุการณ์เราเรียกว่าตัวแปรสุ่มgene ถูกกำหนดค่าลงไปแล้ว   แต่ตอนที่ก่อนเหตุการณ์ ตัวแปรนี้ยังไม่ถูกกำหนดค่า ก็จะมีโอกาศ จะเป็นชาย หรือ หญิงก็ได้ โอกาสก็เท่าๆกัน      สมมุติว่ามีเหตุการณ์การตรวจเลือด  ซึ่งสามารถบอกในทางสถิติได้ว่าลูกจะเป็นชายหรือหญิงในความแม่นยำ 60% (ค่าความถูกต้องในอดีต)   ความน่าจะเป็นของตัวแปร gene จะถูกกำหนดค่าหลังคลอดหลังเหตุการณ์ถูกตรวจเลือดเปลี่ยนไปเป็นโอกาสไม่เท่ากันแล้ว  เมื่อเรารู้ผลการตรวจเลือด  เพื่อที่จะอธิบายความน่าจะเป็นตรงนี้ Probability distribution function จึงถูกกำหนดขึ้นเพื่ออธิบายโอกาสที่ gene จะเลือกค่า  ในขณะที่เหตุการณ์ยังไม่เกิด

วิธีการนำไปใช้ของ Random Variables จึงเป็นการพยากรณ์ว่าค่า random variables จะเลือกค่าใดในอนาคตหลังจากเหตุการ์ณเกิด  โดยมักจะเลือกโอกาสที่มากที่สุด   ด้วยคำว่ามากที่สุด  เราได้เปลี่ยนปัญหาการทายค่า random variables (random variable inference) ให้เป็นปัญหาการหาค่าสูงสุด (optimization problems).

และนี่คือพื้นฐานความเข้าใจของ Machine Learning.

ความคิดเห็น

แสดงความคิดเห็น

บทความที่ได้รับความนิยม