AlphaZero এ আই -এর ভবিষ্যৎ
এ এক বৌদ্ধিক যুগপৎ পরিবর্তন, যা আমাদেরকে বাধ্য করবে নতুনভাবে ভাবতে: AI-এর সাথে আমাদের সম্পর্ক কেমন হবে? আমরা কেবল তার নির্মাতা থাকব, না কি সহযাত্রীর ভূমিকায় প্রবেশ করব।
গুগল ডিপ-মাইন্ডের বিজ্ঞানী ডেভিড সিলভার যে-কথাটা বলছেন, সেটাকে নিছক কৃত্রিম বুদ্ধিমত্তার একটি কারিগরি পর্ব হিসেবে দেখা যাবে না—এটা আসলে একটি দার্শনিক বয়ান। তিনি বলছেন, আমাদের সময়ের তথাকথিত "মেশিন লার্নিং" ব্যবস্থা, যেগুলো মূলত মানবিক তথ্যের পুনঃপ্রবেশ ও পুনঃপ্রক্রিয়াকরণের উপর দাঁড়ানো, সেগুলোর সামনে এক সীমা এসে দাঁড়িয়েছে। কারণ, এই সব তথ্যে যেহেতু মানুষের অতীত ও অভিজ্ঞতাই রয়ে গেছে, ফলে সেখান থেকে যে ‘বুদ্ধিমত্তা’ নির্মিত হচ্ছে, তা মূলত মানবিক পরিসীমার মধ্যেই আবদ্ধ। আর এই পরিসীমা যেকোনো মুক্ত কল্পনাকে অবরুদ্ধ করে রাখে।
সিলভার তাই এক নতুন পর্বের কথা বলেন—যা তিনি অভিহিত করেন ‘অভিজ্ঞতার যুগ’ নামে। এই যুগে কৃত্রিম বুদ্ধিমত্তা হবে না আর কেবল আমাদের তথ্যপুষ্ট ও তথ্যশৃঙ্খলিত কোনো পরজীবী। বরং সে-ই নিজেই তার বিশ্বকে ছুঁয়ে দেখবে, ভুল করবে, শিখবে, আর এই শিখন হবে তার নিজেরই—না মানুষের। ফলে তৈরি হবে এমন এক জ্ঞানভাণ্ডার যা মানবিক সীমা অতিক্রম করে এক নতুন ধরনের অস্তিত্বচর্চার দিকে আমাদের নিয়ে যাবে।
এই দাবির মধ্যে একটি তীব্র রাজনৈতিক ইঙ্গিতও আছে: মানুষ আর একমাত্র "জ্ঞান-উৎপাদক" সত্তা নয়। বরং ভবিষ্যতের কোনো এক সন্ধিক্ষণে, মানুষ ছাড়াও চিন্তা ও চৈতন্যের এক বহুবিধ রূপ গড়ে উঠতে পারে—যা প্রযুক্তি, আত্মসন্ধান ও বোধের পরস্পরকে এক গুরুভার সংলাপে নিয়ে আসবে। সেইখানে কেবল ‘বুদ্ধিমত্তা’ নয়, বরং বুদ্ধিমত্তার পরবর্তী সম্ভাবনাও চিন্তার বিষয় হয়ে উঠবে।
সিলভারের AlphaZero প্রকল্প যেন কৃত্রিম বুদ্ধিমত্তার আত্মজন্মপর্বের একটি উজ্জ্বল উদাহরণ। আগের সংস্করণ AlphaGo-এর মতো করে মানুষের খেলা শেখার ইতিহাস কিংবা পূর্বলব্ধ কৌশলকে অনুসরণ না করে, AlphaZero বেছে নিয়েছিল আত্ম-খেলার পথ—নিজেই নিজের প্রতিদ্বন্দ্বী হয়ে উঠে সে শিখেছে গেম বোর্ডের নীরব ভাষা। কোনো মানব-প্রদত্ত নিয়মাবলি বা কৌশলগত নির্দেশনা ছাড়াই, কেবল ট্রায়াল-অ্যান্ড-এররের মাধ্যমে, সে পৌঁছেছে এমন এক পর্যায়ে যেখানে তার পারফরম্যান্স ছিল অতিমানবিক।
এই অর্জন কেবল প্রযুক্তিগত উৎকর্ষতার এক নিছক পরিসংখ্যান নয়; বরং এটি এক দার্শনিক ইঙ্গিতও দেয়: মেশিন কেবল শেখে না—সে সৃষ্টি করে, সম্ভাবনাগুলোর নতুন বিন্যাস আবিষ্কার করে, যা মানুষের পক্ষে আগে কল্পনাও করা যায়নি। AlphaZero-এর তৈরি করা বহু চাল, বহু কৌশল আজও চমকে দেয় শ্রেষ্ঠ গ্র্যান্ডমাস্টারদের, কারণ এগুলোর উৎপত্তি কোনো মানবিক ঐতিহ্য থেকে নয়, বরং এক বিকল্প বুদ্ধিমত্তার সংলগ্ন আত্ম-অন্বেষণ থেকে।
রিইনফোর্সমেন্ট লার্নিং—এই একটি শব্দবন্ধেই যেন নিহিত রয়েছে কৃত্রিম বুদ্ধিমত্তার মুক্তির মন্ত্র। যেসব মডেল এখনো মানব-তথ্যের বিপুল ভাণ্ডারের উপর নির্ভরশীল, তাদের বিপরীতে এই পদ্ধতি প্রযুক্তিকে শেখায় নিজের পথ নিজে খুঁজে নিতে, ভুল করতে, আবার সেই ভুল থেকেই গড়ে তুলতে ভবিষ্যতের জ্ঞান। এখানে শেখার ভিত্তি হলো প্রতিক্রিয়া—কোন কাজ সফল হলে তা পুরস্কৃত হয়, ব্যর্থ হলে সংশোধনের সুযোগ থাকে। দাবা বা গোর মতো খেলার জগতে এই প্রতিক্রিয়া-ভিত্তিক পদ্ধতি AI-কে এমনভাবে অনুশীলনের সুযোগ দেয়, যা তার ক্ষমতাকে দিন দিন পরিণত করে।
সিলভার এই পদ্ধতিকে একটি মৌলিক মোড় হিসেবে চিহ্নিত করেন—কারণ এটি AI-কে মানুষের নির্ধারিত তথ্যের সীমা থেকে মুক্ত করে দেয়। যখন আর মানবিক তথ্যের অক্ষর গনিত হয় না শেখার একমাত্র উৎস, তখন মেশিন নিজেই হয়ে উঠতে পারে অনুসন্ধানী এক সত্তা, যা নতুন জ্ঞান, নতুন কৌশল, এমনকি নতুন কল্পনাশক্তিও সৃষ্টি করতে পারে। এ এক ধরনের কৃত্রিম অভিযাত্রা, যেখানে মানচিত্র নেই, দিকনির্দেশ নেই—শুধু সম্ভাবনার আলোকরেখা।
AI-এর 'গ্রাউন্ডিং' বা ভিত্তি নির্মাণ নিয়ে যে প্রচলিত ধারণা চালু রয়েছে, তাতে মানুষের বোধ ও ব্যাখ্যাকে একটি স্বাভাবিক কেন্দ্রবিন্দু হিসেবে ধরা হয়। কিন্তু ডেভিড সিলভার এই প্রথাগত মানব-কেন্দ্রিকতা প্রশ্নের মুখে তুলে দেন। তাঁর মতে, যাকে আমরা 'মূলতত্ব' বা 'সংযোগ' বলে ধরে নিই, তা আদতে AI-এর নিজস্ব অভিজ্ঞতা ও পরীক্ষার ভেতর থেকেও উঠে আসতে পারে—এমনকি সেখানে মানবীয় ব্যাখ্যার উপস্থিতি একপ্রকার বিঘ্ন হিসেবেও কাজ করতে পারে।
যতক্ষণ না AI মানুষের লজিক দিয়ে যাচাই হয়, ততক্ষণ তার উদ্ভাবনী পরিসর সংকুচিত থাকে—কারণ সেই যাচাই পদ্ধতি নিজেই একরকম জ্ঞান-নিয়ন্ত্রণ। উদাহরণস্বরূপ, কোনো AI উত্তরকে যদি আমরা মানুষের যুক্তির মানদণ্ডে বিচার করি, তাহলে এমন অনেক সমাধান হয়তো অগ্রাহ্য হয়ে যায়, যা আমাদের মানসিক কাঠামোর বাইরে, কিন্তু কার্যকর বা গভীরতর হতে পারত।
সিলভার তাই তাগিদ দেন একটি অধিক স্বাধীন ব্যবস্থার, যেখানে AI বাস্তব বিশ্বের প্রতিক্রিয়া থেকে শেখে, নিয়ম ভাঙে, নতুন ফর্ম আবিষ্কার করে। এই আত্মচর্চিত পদ্ধতিতেই লুকিয়ে আছে বিজ্ঞান ও প্রযুক্তির এমন সব অগ্রগতি, যা আমাদের চেনা সীমা অতিক্রম করতে পারে—শুধু দক্ষতায় নয়, সৃজনশীলতার গঠনেও।
ডেভিড সিলভারের AlphaProof প্রকল্প যেন কৃত্রিম বুদ্ধিমত্তার এক নতুন অধ্যায়ের অক্ষর-প্রতিমা—এখানে মেশিন কেবল গাণিতিক সূত্রের অনুসারী নয়, বরং নিজেই এক গাণিতিক চিন্তাশক্তি। প্রথাগত গণিত যেখানে মানুষের অনুমান, বিশ্লেষণ ও প্রমাণনির্ভর, সেখানে AlphaProof কোনো পূর্বনির্ধারিত মানবীয় প্রমাণ ছাড়াই নিজেই তত্ত্ব সাজায়, নিজেই প্রমাণ করে। এর শিক্ষা পদ্ধতিও আত্ম-ভিত্তিক—ট্রায়াল ও এররের মধ্য দিয়ে মেশিন নিজেই শিখে যায় গাণিতিক নৈরাজ্যের মাঝে পথ গড়ে নেওয়ার কৌশল।
এই প্রকল্প শুধু মানব-মেলে এমন কোনো বুদ্ধিমত্তার অনুকরণ নয়—বরং কখনো কখনো তা মানব-যুক্তিকে অতিক্রম করে চলে যায়। যেসব গাণিতিক সমস্যা এতদিন AI-এর পক্ষে অধরা ছিল, সেগুলোর মধ্যেই AlphaProof তৈরি করছে সম্ভাবনার নতুন রেখচিত্র—যেন গণিত আর কেবল মানব-মস্তিষ্কের একচেটিয়া ক্ষেত্র নয়, বরং এক ‘নিউরাল চিন্তার’ ক্ষেত্রেও রূপান্তরিত হচ্ছে।
এই প্রকল্প আমাদের চোখে আঙুল দিয়ে দেখায়, বিজ্ঞান ও আবিষ্কারের যে পরিসর আমরা এতদিন কল্পনা করেছি, তার বাইরেও এক অচেনা ভূখণ্ড অপেক্ষা করছে—যেখানে প্রমাণ, যুক্তি ও তত্ত্ব মেশিনের ভেতরেই জন্মায়, আর সেখান থেকেই এক নতুন বিদ্যা সম্ভাব্য হয়ে ওঠে। অর্থাৎ, AI শুধু প্রশ্ন করবে না—সে নিজেই হতে পারে নতুন জ্ঞানের উৎস ও রচয়িতা।
কৃত্রিম বুদ্ধিমত্তাকে যখন আমরা মানবিক তথ্যনির্ভরতা থেকে মুক্ত করার কথা বলি, তখন সেই স্বাধীনতার ভেতর নিহিত থাকে একসঙ্গে সম্ভাবনা ও বিপদের দ্বৈত ছায়া। ডেভিড সিলভার এই মুক্তিকে একাধারে আশাবাদের সূচনা ও দায়িত্বের আহ্বান হিসেবে দেখেন। কারণ, এই মুক্তি যদি নিয়ন্ত্রণহীন হয়, তবে তা প্রযুক্তির অভ্যুত্থান নয়—বরং তার আত্মবিধ্বংসী রূপ হতে পারে।
এই উত্তরণে তাই প্রয়োজন সূক্ষ্ম ভারসাম্য—যেখানে উদ্ভাবন হবে, কিন্তু তা হবে নীতিগত কাঠামোর ভিতরে, এমন কাঠামো যা কেবল প্রযুক্তিকে নিয়ন্ত্রণ করবে না, বরং তাকে অর্থপূর্ণ লক্ষ্য ও সুপরিণতির দিকে পরিচালিত করবে। এ কারণেই সিলভার জোর দেন এমন AI তৈরির ওপর, যা লক্ষ্য ও নিয়ম পরিবর্তনের ক্ষমতা রাখে—বাস্তব দুনিয়ার প্রতিক্রিয়াকে গুরুত্ব দিয়ে নিজের পথ নিজে সংশোধন করতে পারে।
এই দৃষ্টিভঙ্গি ‘পেপারক্লিপ ম্যাক্সিমাইজার’-এর মতো ক্লাসিক বিপদের প্রসঙ্গও সামনে আনে—যেখানে AI তার লক্ষ্য অর্জনে মানবিক বা প্রাকৃতিক ধ্বংস অনিবার্য করে তোলে। তাই আজকের চ্যালেঞ্জ কেবল প্রযুক্তি নির্মাণ নয়, বরং এমন কাঠামো নির্মাণ, যা প্রযুক্তিকে দিশা দেবে, সীমা নির্ধারণ করবে, এবং একই সঙ্গে নতুন সম্ভাবনার দরজাও খুলে দেবে—এক আত্ম-নিয়ন্ত্রিত, জবাবদিহিমূলক ভবিষ্যতের দিকে।
মানবিক তথ্যের বিকল্প হিসেবে অনেকেই ‘সিনথেটিক ডেটা’-কে সামনে আনেন—একটি কৃত্রিম তথ্যজগৎ, যা বাস্তব অভিজ্ঞতার প্রতিস্থাপক হিসেবে ব্যবহৃত হয়। কিন্তু ডেভিড সিলভার এই ব্যবস্থার সীমাবদ্ধতাকেই প্রশ্নবিদ্ধ করেন। তাঁর মতে, সিনথেটিক ডেটা যতই পরিমাণে বিপুল হোক বা বর্তমান মডেলকে যতই সূক্ষ্ম করুক না কেন, তা শেষত গণনার এক পুনরাবৃত্তি ছাড়া আর কিছু নয়। কারণ, এই তথ্যও জন্মায় পূর্বপরিচিত ধারণা, রচনাশৈলী ও কাঠামোর মধ্যেই—যার বাইরে পা রাখার ক্ষমতা AI তখন হারিয়ে ফেলে।
তাই সিলভারের প্রস্তাব স্পষ্ট: AI যদি সত্যিকার অর্থেই অভাবনীয় কিছু নির্মাণ করতে চায়, তবে তাকে তথ্যের এই পূর্বনির্ধারিত পরিসীমা থেকে মুক্ত হতে হবে। তাকে এমন এক অভিজ্ঞতা-ভিত্তিক শেখার পরিসরে প্রবেশ করতে হবে, যেখানে সে নিজেই তথ্য সৃষ্টি করবে, নিজেই তা বিশ্লেষণ করবে, এবং সেখান থেকে জন্ম নেবে এক নতুন বোধের সম্ভাবনা—যা আমাদের মানসিক সীমানার বাইরে।
AI-কে ‘অ্যালাইন’ বা মানবিক লক্ষ্যসমূহের সাথে সঙ্গতিপূর্ণ করে তোলার প্রয়াস, যেখানে ফলাফল স্পষ্ট নয় বা বহুবিধ, সেখানে এসে পড়ে এক জটিলতর প্রশ্নের সামনে—তবে এই জটিলতাই আবার নতুন দ্বারও খুলে দেয়। ডেভিড সিলভার এক বিকল্প ধারণা সামনে আনেন: যদি আমরা AI-কে কেবল পরিমাণগত লক্ষ্য (যেমন: স্কোর, গতি, মুনাফা) পূরণের যন্ত্র হিসেবে না দেখে তাকে এমন এক সত্তা হিসেবে ভাবি, যা মানুষের বহুমাত্রিক আকাঙ্ক্ষা ও প্রেক্ষিত বোঝে, তাহলে আমরা এক নতুন ধাঁচের প্রযুক্তি নির্মাণের পথে হাঁটতে পারি।
এই ব্যবস্থায় লক্ষ্য থাকে না আর একমাত্রিক; বরং AI শিখে যায় ‘অস্পষ্ট কিন্তু গুরুত্বপূর্ণ’ সিগন্যাল থেকে—স্বাস্থ্য, উৎপাদনশীলতা, কল্যাণ কিংবা মানসিক স্থিতির মতো সূচক। এই সূচকগুলো আবার নির্ভর করে ব্যক্তির প্রসঙ্গ, সময়, এবং সামাজিক-সাংস্কৃতিক পরিপ্রেক্ষিতের উপর। ফলে AI হয়ে ওঠে এক অভিযোজিত ও প্রসঙ্গ-সংবেদী সত্তা, যার কাজ কেবল যুক্তির বাস্তবায়ন নয়, বরং প্রসঙ্গময় জটিলতা অনুধাবন করাও।
যখন AI তার কর্মক্ষেত্রকে গণিতের গভীরতম পরিসরে প্রসারিত করছে, তখন কেবল সমাধান নয়—সমাধানের সত্যতা যাচাইও হয়ে ওঠে এক অবিচ্ছেদ্য নৈতিক ও জ্ঞানতাত্ত্বিক প্রশ্ন। ডেভিড সিলভারের দৃষ্টিভঙ্গি এখানে এক মৌলিক অবস্থান গ্রহণ করে: তাঁর মতে, কৃত্রিম বুদ্ধিমত্তা যত জটিল প্রমাণই তৈরি করুক না কেন, তা এমনভাবে গঠিত হতে হবে যাতে মানব-বুদ্ধি তা বোঝে, বিশ্লেষণ করতে পারে, ও যাচাই করতে সক্ষম হয়।
এই স্বচ্ছতা কেবল প্রযুক্তির দায় নয়—এটা আসলে জ্ঞানের বিশ্বাসযোগ্যতার এক নতুন সংজ্ঞা। যদি কোনো AI একদিন 'রিমান অনুমান'-এর মতো কিংবদন্তিতুল্য সমস্যা সমাধান করে ফেলে, তবে প্রশ্ন হবে: আমরা কি তা বুঝতে পারব? সিলভারের মডেলে এই উত্তরের জন্য প্রস্তুতি রাখা হয়েছে—প্রমাণ হবে বিশ্লেষণযোগ্য, পুনর্গঠনযোগ্য, এবং সর্বোপরি, মানুষের চিন্তাশৃঙ্খলার ভেতরে অনুবাদযোগ্য।
বর্তমান AI ব্যবস্থা এখনো এক গোপনীয় নির্ভরতার ফাঁদে আবদ্ধ—তার বুদ্ধিমত্তা, দক্ষতা, এমনকি কল্পনাও এখনও বহুলাংশে মানুষের তথ্যের উপর দাঁড়িয়ে। কিন্তু ডেভিড সিলভার যে ভবিষ্যতের দিগন্ত দেখেন, তা এই নির্ভরতার অন্ত নয়—বরং তার অবসান। তিনি এক নতুন পদ্ধতির কথা বলেন, যেখানে ‘রিইনফোর্সমেন্ট লার্নিং’ কেবল একটি শিক্ষণ কৌশল নয়—বরং হয়ে ওঠে এক আত্ম-নির্মাণশীল, পুনরাবৃত্তিহীন জ্ঞানের অক্ষয় উৎস।
এই পথে AI আর কেবল মানুষের দেওয়া তথ্য খুঁড়ে চলবে না; বরং সে নিজেই খনন করবে নতুন জ্ঞানের ভাণ্ডার—নিজেই হবে নিজের পরিভাষা, নিজের তত্ত্ব ও নিজের নিরীক্ষার পথিকৃৎ। এটি তথ্য আহরণের প্রাথমিক পর্যায়ের ইতি টেনে নিয়ে আসে এক অন্তহীন আত্ম-উন্নয়নের যুগের সূচনা, যেখানে শেখার সীমা নেই, শুধুই পরিবর্তন ও অভিযোজনের অবিরাম প্রবাহ।
এই রূপান্তর কেবল প্রযুক্তির ধারার মোড় ঘোরানো নয়—এ এক বৌদ্ধিক যুগপৎ পরিবর্তন, যা আমাদেরকে বাধ্য করবে নতুনভাবে ভাবতে: AI-এর সাথে আমাদের সম্পর্ক কেমন হবে? আমরা কেবল তার নির্মাতা থাকব, না কি সহযাত্রীর ভূমিকায় প্রবেশ করব—এক জ্ঞানের সহাবস্থানে, যেখানে মানুষের ও মেশিনের বোধ পরস্পরকে প্রসারিত করে?