Game Theory : ট্রাভেলার’স ডিলেমা

পুরোটা পড়ার সময় নেই? ব্লগটি একবারে শুনে নাও!

 

আমরা আগের পর্বে অর্থনীতির ক্ষেত্রে গেইম থিওরির জন্য একটি উদাহরণ বিবেচনা করেছিলাম।

সেটি এমন ছিল যে, ওয়ালটন কোম্পানি কোনো একটা স্মার্টফোন প্রোডাক্ট থেকে মাসিক মুনাফা পায়- ৫০ কোটি টাকা। অন্যদিকে সিমফোনি কোম্পানিও সমান কনফিগারেশনের একটা স্মার্টফোন থেকে মাসিক মুনাফা পায়- ৫০ কোটি টাকা। এখন ওয়ালটন ভাবলো যে, তাদের পণ্যের দাম যদি খানিকটা কমানো যায়, তাহলে বিক্রি বেশি হবে। তখন লাভ আগের চাইতে বেশি হবে।

ধরা যাক, তখন লাভ হল, ৫৫ কোটি টাকা। এতে ওয়ালটনের বিক্রি ও লাভ বাড়লেও সিমফোনির কিন্তু বিক্রি কমবে, লাভও কমবে। কারণ, একই জিনিস বেশি দাম দিয়ে নিশ্চয়ই কেউ কিনতে চাইবে না। তাই সিমফোনিও একই ভাবে দাম কমিয়ে আনবে। তখন এই দু’টো কোম্পানি্র অ্যাবসলিউট লাভ হয়তো আগের চাইতে বাড়বে, কিন্তু রিলেটিভ লাভ বা অনুপাত আগে যা ছিল তাই থাকবে। ফলে, পুরো ব্যবস্থাটি আবার আগের অবস্থায় ফিরে যাবে। কি! এবার রহস্যটা বুঝলে তো?

দারুণ সব লেখা পড়তে ও নানা বিষয় সম্পর্কে জানতে ঘুরে এসো আমাদের ব্লগের নতুন পেইজ থেকে!

এবার এসো গাণিতিকভাবে গেইম থিওরি বোঝার চেষ্টা করি। তার জন্য আগে ট্রাভেলার’স ডিলেমা নামে একটি অত্যন্ত মজার বিষয় সম্পর্কে জানতে হবে।

Traveler’s Dilemma

১৯৯৪ সালে কর্ণেল ইউনিভার্সিটির অর্থনীতির অধ্যাপক কৌশিক বসু এই অবস্থাটিকে ব্যাখ্যা করার জন্যে ‘গেম থিওরি’র একটা মজার সমস্যা প্রস্তাবনা করেন। যা ‘ট্রাভেলারস ডিলেমা’ (Travelers Dilemma) বা, ভ্রমণকারীর উভয়সঙ্কট নামে পরিচিত।

ধরা যাক, লুসি ও পিট দুইজন বিমানযাত্রী। তারা জার্মানী থেকে দেশে ফিরছেন। ঘটনাক্রমে তাদের সুটকেস হারিয়ে যায়। ধরো দুজনের সুটকেস হুবহু একইরকম দেখতে এবং তাতে সমমূল্যের জিনিস ছিল। তারা দুজনে কর্তৃপক্ষের নিকট অভিযোগ করলে এয়ারলাইন ম্যানেজার তাদেরকে বলল যে, তিনি ক্ষতিপূরণ দিতে রাজি আছেন। কিন্তু যেহেতু জিনিসগুলোর সঠিক মূল্য জানা সম্ভব ছিল না, তাই তিনি বললেন ক্ষতিপূরণ হিসেবে সর্বোচ্চ ১০০ ডলার দেয়া যাবে।

এবার তিনি একটা কৌশল অবলম্বন করলেন। তাদের দুজনকে আলাদা জায়গায় রেখে বলা হলো ক্ষতির পরিমাণের দাম লিখে ম্যানেজারকে দিতে। কিন্তু সেখানে কিছু শর্ত বেঁধে দিলেন। প্রথম শর্ত হচ্ছে দামটা ২ থেকে ১০০ ডলারের মধ্যে হতে হবে, যেহেতু তিনি আগেই বলেছেন ১০০ ডলারের বেশি ক্ষতিপূরণ কর্তৃপক্ষ দিবে না। দ্বিতীয় শর্ত হলো যদি তারা দু’জন একই দাম লিখে দেয়, তাহলে ম্যানেজার সেটাকেই প্রকৃত মূল্য বা বেইস হিসেবে ধরে নেবে এবং দুইজনকেই সেই পরিমাণ ডলার দিয়ে দেবে। যেমন: লুসি ও পিট দুইজনই যদি ৫০ ডলার লেখে, তাহলে দুইজনকেই ৫০ ডলার দিয়ে দেওয়া হবে।

dilemma, Game, Game theory, Theory, travelller's, গেইম, গেইম থিওরি, ট্রাভেলারস, ডিলেমা, থিওরি

তৃতীয় শর্ত হলো, যদি দুইজনের মধ্যে কোন একজন আরেকজনের চেয়ে কম দাম লেখে, তাহলে ম্যানেজার কম পরিমাণের ডলারটাকে আসল বা বেইস ধরবে। একইসাথে যে কম ডলারটা লিখলো তার ডলারের পরিমাণকে সত্যি ধরে সততার পুরস্কার হিসেবে তাকে দুই ডলার বেশি দিয়ে দেবে এবং যে বেশি পরিমাণ ডলার দাবি করল তাকে দুই ডলার কম দেবে। যেমন: লুসি যদি দাবি করে ৮০ ডলার এবং পিট দাবি করে ৯০ ডলার তাহলে ধরে নেয়া হবে লুসি সত্য বলছে অর্থাৎ তখন ৮০ ডলারকেই বেইস হিসেবে ধরা হবে। সততার পুরস্কারসহ লুসি পাবে (৮০+২) বা ৮২ ডলার। অপরদিকে পিট পাবে (৮০-২) বা ৭৮ ডলার।

ঘুরে আসুন: জেনে নাও স্মৃতিশক্তি বাড়ানোর সহজ কিছু কৌশল

এই হলো শর্ত। এগুলো আলাদা আলাদাভাবে বুঝিয়ে দিয়ে লুসি ও পিট-কে দুটি আলাদা আলাদা ঘরে নিয়ে যাওয়া হলো এবং বলা হলো দামটা লিখে ম্যানেজারকে দিতে। এখানে ধরে নেওয়া যাক, লুসি ও পিট দুজনই সমান ও উচ্চ মানের বোধবুদ্ধিসম্পন্ন। অর্থাৎ দু’জনেই যুক্তিসঙ্গত চিন্তা করে। এবং তারা দু’জন দুজনের বুদ্ধিমত্তা সম্পর্কেও অবগত। সেই সাথে দুজনই অধিক মুনাফা লাভের ব্যাপারে আগ্রহী।

এখন আমরা যুক্তির বিচারে তাদের দুজনের অবস্থাকে বর্ণনা করব। যে কেউ কাগজ পাওয়ার সাথে সাথেই ১০০ ডলার লিখে ফেলবে। কারণ এটাই সবচেয়ে বেশি মানের ডলার যা সে পেতে পারে। জিনিসটার দাম যদি ১০০ ডলারের কম হয় তাহলে ১০০ ডলার পেলে তো তার লাভই হয়! লুসিও তাই করলো। কিন্তু ঠিক তখনি তার মাথায় আরেকটা চিন্তা আসবে। সে তখন ভাববে, পিটও নিশ্চয়ই ১০০ ডলারই লিখবে। এর চেয়ে বরং আমি এক কাজ করি। আমি লিখে দেই ৯৯ ডলার। এতে করে সে সততার পুরস্কার হিসেবে (৯৯+২) বা ১০১ ডলার পেয়ে যাবে। ওদিকে পিট পাবে (৯৯-২) বা ৯৭ ডলার। ফলে, কৌশলগত কারণে লুসি পিটের চাইতে ৪ ডলার বেশি পাচ্ছে!

দেখে নাও আমাদের Interactive Video গুলো!

এতদিন আমরা শুধু বিভিন্ন ইন্সট্রাক্টর ভাইয়া-আপু’দের ভিডিও দেখেছি। কেমন হবে যদি ভিডিও চলার মাঝখানে আমরা কতটুকু শিখেছি সেটার উপর ছোট ছোট প্রশ্ন থাকে?
না, ম্যাজিক না। দেখে নাও আমাদের Interactive Video প্লে-লিস্ট থেকে!

১০ মিনিট স্কুলের Interactive Video!

এই ভেবে সে যখনই ৯৯ ডলার লিখে ফেলবে ঠিক তখনি তার মাথায় আরেকটা ব্যাপার খেলা করবে। সে ভাববে, পিটও নিশ্চয়ই আমি যা ভাবছি তা ভাবছে (কারণ দুজনই যুক্তিসঙ্গত চিন্তা করে এবং তা উভয়েই জানে) তাহলে সেও তো ৯৯ ডলারই লিখবে! তাহলে আমি ৯৯ ডলার না লিখে বরং ৯৮ ডলার লিখি তাহলে আমি পাব (৯৮+২) বা ১০০ ডলার আর পিট পাবে (৯৮-২) ডলার বা ৯৬ ডলার! এখানেও ৪ ডলার বেশি।

এই যুক্তিকে আরো সামনে বাড়তে দিলে দেখা যায় এই ব্যাপারটা একটা সিরিজের মতো করে চলতে থাকবে কেননা লুসি মানসিকভাবে একটি যুক্তির লুপে আটকা পড়ে যাবে। আর তাই তার ডলারের পরিমাণটা ধীরে ধীরে কমতেই থাকবে! ৯৮ থেকে ৯৭, ৯৭ থেকে ৯৬, ৯৬ থেকে ৯৫- তাত্ত্বিকভাবে ডলারের পরিমাণটা কমেই যেতে থাকবে। একটা সময় কমতে কমতে এটা তাত্ত্বিকভাবে দুই ডলারে গিয়ে থামবে! যেহেতু নির্ধারিত শর্তমতে, পণ্যের মূল্য সর্বনিম্ন ছিল দুই।

অপরদিকে এই একই চিন্তাভাবনাগুলো কিন্তু পিটের মাথায়ও খেলা করতে থাকবে! কিভাবে নিজে একটু বেশি ডলার পাওয়া যায়, সেটার জন্য লুসি কম পেলে পাক!

এখানেই ‘গেইম থিওরি’র শুরু। ছোট্ট ঘটনাকে কেন্দ্র করে লুসি ও পিটের মধ্যে একটা অলিখিত প্রতিদ্বন্দ্বীতা শুরু হয়ে গেছে। অবশ্য অনেকেই বলতে পারে, দুজনেই যদি সত্যটা লিখে, তাহলে তো আর কোনো সমস্যা হয় না। কিন্তু বাস্তব জীবনে ব্যবসার ক্ষেত্রে হিসেব-নিকেশগুলো এরকমই প্রতিদ্বন্দ্বীতামূলক।

যাইহোক, লুসি এবং পিটের বিভিন্ন কৌশল ও তার ফলাফলকে আমরা বোঝার সুবিধার্তে নিচের ম্যাট্রিক্স আকারে সাজিয়ে লিখতে পারি-

গেম থিওরিতে এ ধরণের ম্যাট্রিক্সকে বলা হয় পে-অফ ম্যাট্রিক্স। পে-অফ ম্যাট্রিক্সটা খেয়াল করলে দেখা যাবে- এখানে লুসি এবং পিটের লেখা বিভিন্ন ডলার পরিমাণের সাপেক্ষে তাদের প্রাপ্ত ক্ষতিপূরণকে দেখানো হয়েছে।

যেমন: লুসি এবং পিট দু’জনই যদি ১০০ ডলার লেখে, আমরা জানি যে দুজনই ১০০ ডলার করে পাবে। একদম নিচে সবচেয়ে ডানের ঘরে তাই আমরা (১০০- ১০০) দেখতে পাচ্ছি। আবার ধরি, লুসি লিখল ৩ ডলার, পিট লিখল ৪ ডলার। তাহলে আমরা জানি যে ম্যানেজার ৩ ডলারকে বেস হিসেবে ধরে লুসিকে দিবে (৩+২) বা ৫ ডলার। আর পিটকে দিবে (৩-২) বা ১ ডলার। (৫- ১) লেখা ঘরটা কিন্তু তাই নির্দেশ করে।

এই পুরো ব্যাপারটা থেকে আসলে যে সিদ্ধান্তটা নেওয়া যায় তা হচ্ছে, সবসময় অসঙ্গতিপূর্ণ প্রতিদ্বন্দ্বিতা আমাদেরকে কাঙ্ক্ষিত সাফল্য দেয় না। সহযোগিতাপূর্ণ এবং নৈতিক চিন্তাভাবনা আমাদের জন্যে বেশি লাভজনক।

ন্যাশের সাম্যাবস্থা (Nash Equilibrium)

‘গেম থিওরি’র একটি গুরুত্বপূর্ণ বিষয় হচ্ছে ‘ন্যাশ সাম্যাবস্থা’। পে-অফ ম্যাট্রিক্সের একটা বিশেষ ঘরের দিকে লক্ষ্য কর। ঘরটা হচ্ছে (২-২)। মনে করে দেখি পিট এবং লুসির শেষমেশ দুইজনই ২ ডলার করে লিখেছিল। এই ঘরটার একটা বিশেষ বৈশিষ্ট্য আছে যা অন্য ঘরগুলোর নেই।

পে-অফ ম্যাট্রিক্সটা একটু ভালভাবে লক্ষ্য করলে আমরা দেখতে পাই যে, যে কোন একজন প্লেয়ারের সিদ্ধান্তকে অপরিবর্তিত রেখে যদি আরেকজন তার সিদ্ধান্ত পরিবর্তন করতে থাকে তাহলে এই (২-২) বাদে বাকি সব ঘরের জন্যই দুই প্লেয়ারের অন্তত একজন হলেও লাভবান হয় অর্থাৎ বেশি ডলার পায়। ব্যাপারটা একটু বিস্তারিতভাবে বলা যাক। (২-২) ছাড়া ম্যাট্রিক্সের যে কোনো একটা ঘর নিই।

এবার ঘরে বসেই হবে মডেল টেস্ট! পরীক্ষা শেষ হবার সাথে সাথেই চলে আসবে রেজাল্ট, মেরিট পজিশন। সাথে উত্তরপত্রতো থাকছেই!

ধরা যাক, লুসি লিখল ৩ এবং পিটও লিখল ৩। তাহলে আমরা পে-অফ ম্যাট্রিক্সের যে ঘরটায় থাকব তা হচ্ছে (৩-৩)। ধরে নিই পিট তার সিদ্ধান্ত অপরিবর্তিত রাখবে অর্থাৎ সে ৩ ই লিখবে। এখন লুসি যদি তার সিদ্ধান্তের পরিবর্তন করে তাহলে কী হয় লক্ষ্য কর:

একটু লক্ষ্য করলেই আমরা দেখতে পাব যে লুসি যদি ৩ না লিখে ২ লিখে তাহলে আমরা থাকব (৪-০) ঘরে অর্থাৎ লুসি ৪ ডলার (২+২) পাবে, যেখানে আগে সে পেত ৩ ডলার। আর পিট পাবে ০ ডলার (২-২)। আবার ধরি লুসি তার সিদ্ধান্ত পরিবর্তন করবেনা অর্থাৎ সে ৩ ই লিখবে। পিট যদি তার সিদ্ধান্তের পরিবর্তন করে ৩ না লিখে ২ লিখে তাহলে আমরা থাকব (০-৪) ঘরে অর্থাৎ পিট পাবে ৪ ডলার, যেখানে আগে সে পেত ৩ ডলার। এখান থেকে আমরা যা বুঝতে পারি (৩-৩) ঘরে থাকলে লুসি তার পাওয়া ডলারের পরিমানটাকে কিন্তু বাড়িয়ে নিতে পারবে, যদি পিট তার সিদ্ধান্তে অটল থাকে। একই কথা পিটের জন্যেও খাটবে।

ঘুরে আসুন: ৬টি উপায়ে চিনে নিন Fake News!

কিন্তু এবার (২-২) ঘরটার কথা ভাবা যাক। আমরা যদি পে-অফ ম্যাট্রিক্সটা একটু ভালভাবে লক্ষ্য করি তাহলে দেখতে পাব, একজন প্লেয়ারের সিদ্ধান্তকে অপরিবর্তিত রেখে আরেকজন তার সিদ্ধান্ত পরিবর্তন করলে সে কখনোই লাভবান হতে পারবে না।

ব্যাপারটাকে এভাবে বলা যায় যে লুসি যদি ২ ডলার লিখে সে নিশ্চিতভাবে বলতে পারবে যে পিট যাই লিখুক না কেন কখনোই ২ ডলারের চেয়ে বেশি পাবে না আর সে নিজে অন্তত ২ ডলার পাবেই। আবার পিটও যদি ২ ডলার লিখে সে নিশ্চিতভাবে বলতে পারবে যে লুসি কখনোই ২ ডলারের চেয়ে বেশি পাবে না এবং সে নিজে অন্তত ২ ডলার পাবেই। কারণ, ২ ডলারই বেজ। ২ ডলার যে-ই লিখুক না কেন, ম্যানেজার তখন ২-কে বেজ ধরবে। তাই (২-২) ঘরেই এসে শেষমেশ তারা স্থির হবে। ফলে (২-২) ঘরটা একটা সাম্যাবস্থা নির্দেশ করবে। একেই বলা হয় Nash Equilibrium বা ‘ন্যাশের সাম্যাবস্থা’।

আগামী পর্বে ট্রাভেলার’স ডিলেমার মতো গেইম থিওরির আরও কিছু উদাহরণ তুলে ধরবো যা তোমাকে বিস্মিত করবে। পড়তে ভুলো না কিন্তু!

এই লেখাটির অডিওবুকটি পড়েছে মেহের আফরোজ শাওলী


১০ মিনিট স্কুলের লাইভ এডমিশন কোচিং ক্লাসগুলো অনুসরণ করতে সরাসরি চলে যেতে পারো এই লিঙ্কে: www.10minuteschool.com/admissions/live/

১০ মিনিট স্কুলের ব্লগের জন্য কোনো লেখা পাঠাতে চাইলে, সরাসরি তোমার লেখাটি ই-মেইল কর এই ঠিকানায়: write@10minuteschool.com

লেখাটি ভালো লেগে থাকলে বন্ধুদের সঙ্গে শেয়ার করতে ভুলবেন না!
Author

Ariful Hasan Shuvo

A simple human being who lives in two universes in parallel. One you see, the other one is inside his head where there's nothing but thoughts and dreams!
Currently a student of Shahjalal University of Science and Technology
Ariful Hasan Shuvo
এই লেখকের অন্যান্য লেখাগুলো পড়তে এখানে ক্লিক করুন
What are you thinking?