تکراری لسانی ساخت کے انسانی عمل کا ایک وسائل عقلی ماڈل حصہ 3
Jan 23, 2024
تجربہ 2: معنوی اشاروں کا اثر
ہم نے اگلا تجربہ 1 کو آئٹمز کے دوسرے سیٹ پر نقل کیا اور اس کے ساتھ ہی معنوی مطابقت کے پیش گوئی شدہ اثر کا تجربہ کیا۔
معنوی مطابقت سے مراد زبان، الفاظ یا علامتوں میں مختلف اکائیوں کے درمیان مطابقت اور باہمی تعلق کے بارے میں لوگوں کی سمجھ اور مہارت ہے۔ میموری سے مراد لوگوں کی معلومات کو یاد رکھنے اور ذخیرہ کرنے کی صلاحیت ہے۔
معنوی مطابقت اور یادداشت کے درمیان گہرا تعلق ہے۔ اچھی سیمنٹک مطابقت لوگوں کی یادداشت کے معیار کو بہتر بنا سکتی ہے، جب کہ ناقص سیمنٹک مطابقت لوگوں کی معلومات کو سمجھنے اور یادداشت کے اثرات میں رکاوٹ بنے گی۔
سب سے پہلے، معنوی مطابقت معلومات کی مطابقت کو بہتر بنا سکتی ہے، اس طرح لوگوں کو معلومات کو بہتر طور پر سمجھنے اور یاد رکھنے میں مدد ملتی ہے۔ اگر مختلف اکائیوں کے درمیان کوئی واضح ارتباط موجود ہے تو، لوگ اس ارتباط کو معلومات کے درمیان روابط بنانے اور معلومات کے درمیان نیٹ ورک کا ڈھانچہ تشکیل دینے کے لیے استعمال کر سکتے ہیں۔ یہ نیٹ ورک ڈھانچہ معلومات کے میموری اثر کو بہتر بنا سکتا ہے اور لوگوں کی معلومات کو ذخیرہ کرنے کی صلاحیت کو بڑھا سکتا ہے۔
دوم، اچھی سیمنٹک مطابقت معلومات کی سمجھ کو بہتر بنا سکتی ہے، جس سے لوگوں کو یاد رکھنا آسان ہو جاتا ہے۔ اگر معلومات کے درمیان ایک واضح مطابقت کا تعلق ہے، تو لوگ آسانی سے معلومات کے درمیان تعلق کو سمجھ سکتے ہیں، اس طرح معلومات کی سمجھ اور یادداشت کی تشکیل ہوتی ہے۔ اس کے برعکس اگر معلومات کے درمیان واضح عدم مطابقت ہو تو لوگ الجھن اور الجھن کا شکار ہوں گے اور معلومات کو سمجھنے اور یاد رکھنے میں دشواری کا سامنا کرنا پڑے گا۔
آخر میں، کمزور سیمنٹک مطابقت لوگوں کی یادداشت کی کارکردگی کو بری طرح متاثر کر سکتی ہے۔ اگر مختلف اکائیوں میں بہت زیادہ فرق ہو تو لوگوں کے لیے معلومات کو سمجھنا اور یاد رکھنا مشکل ہو جائے گا، اس طرح میموری کی قدر ختم ہو جائے گی۔ اس لیے معلومات کو لکھنے اور پھیلانے کے عمل میں لفظی مطابقت کو ہر ممکن حد تک برقرار رکھا جانا چاہیے تاکہ لوگوں کی سمجھ اور یادداشت کو بہتر بنایا جا سکے۔
خلاصہ یہ ہے کہ لفظی مطابقت اور یادداشت کے درمیان ایک مضبوط رشتہ ہے۔ اچھی سیمنٹک مطابقت معلومات کی مطابقت اور فہم کو بہتر بنا سکتی ہے، اس طرح لوگوں کی معلومات کو ذخیرہ کرنے کی صلاحیت اور یادداشت کے اثر میں اضافہ ہوتا ہے۔ لہذا، روزمرہ کی زندگی اور کام میں، معلومات کی تفہیم اور یادداشت کو بہتر بنانے کے لیے جہاں تک ممکن ہو معنوی مطابقت کو برقرار رکھا جانا چاہیے۔ یہ دیکھا جا سکتا ہے کہ ہمیں یادداشت کو بہتر بنانے کی ضرورت ہے، اور Cistanche deserticola یادداشت کو نمایاں طور پر بہتر بنا سکتا ہے کیونکہ Cistanche deserticola ایک روایتی چینی ادویاتی مواد ہے جس کے بہت سے منفرد اثرات ہیں، جن میں سے ایک یادداشت کو بہتر بنانا ہے۔ کیما بنایا ہوا گوشت کی افادیت اس میں موجود مختلف فعال اجزاء سے آتی ہے، بشمول ایسڈ، پولی سیکرائڈز، فلیوونائڈز وغیرہ۔ یہ اجزاء مختلف طریقوں سے دماغی صحت کو فروغ دے سکتے ہیں۔

یادداشت کو بہتر بنانے کے لیے سپلیمنٹس جانیں پر کلک کریں۔
تجربہ 1 سے دو ہیرا پھیری کے علاوہ، دو اور تین حالتوں میں، ہم نے اضافی طور پر دوسرے سے آخری فعل کے فقرے کو بھی مختلف کیا: مطابقت پذیر حالت میں، پہلا اسم ایک قابل فہم موضوع تھا (مثلاً، "مریض کو ناراض کرنا")؛ غیر مطابقت پذیر حالت میں، یہ نہیں تھا (مثال کے طور پر، "مریض کا علاج")۔ مطابقت پذیر حالت میں، غیر تصدیق شدہ ورژن جیسے کہ "رپورٹ بذریعہ..." کا ترجیحی امکان زیادہ ہونا چاہیے، آخری فعل کی پیشین گوئی کرنا۔ کم درست. ہم نے 42 محرک اشیاء تیار کیں۔
تصویر 3B ان اشیاء کے لیے وسائل کے عقلی ماڈل اور سابقہ نظریات سے پیشین گوئیاں دکھاتا ہے۔ تجربہ 1 کے اثرات کے علاوہ، ماڈل مطابقت پذیر حالت میں، خاص طور پر تین کے اندر زیادہ دشواری کی پیش گوئی کرتا ہے۔ نہ ہی حیرت انگیز نظریہ اور نہ ہی DLT مطابقت کے کسی اثر کی پیش گوئی کرتا ہے۔
ہم نے 200 شرکاء سے پڑھنے کے وقت کا ڈیٹا اکٹھا کیا، جس میں دو اور تین شرائط میں مطابقت پذیر اور غیر مطابقت پذیر دونوں قسمیں شامل ہیں۔ دیگر تمام معاملات میں، تجربہ اور ڈیٹا کا تجزیہ تجربہ 1 سے یکساں تھا۔ پڑھنے کے اوقات تصویر 3B میں دکھائے گئے ہیں۔
تجربہ 1 کے نتائج کو نقل کیا گیا: سب سے پہلے، پڑھنے کے اوقات دو سے تین میں زیادہ تھے(=0.29, 95% CrI [0.24, 0.35], P( < 0) < 0.0001؛ اثر inraw پڑھنے کے اوقات: 337 ms, 95% CrI [267, 411] ms)۔
دوسرا، ایمبیڈنگ تعصب اور "وہ"-شق (=−0 کی موجودگی کے درمیان ایک تعامل تھا۔{5}}6, 95% CrI [−0.1{ {9}}، −0.024]،P( > 0)=0.0007)۔ جیسا کہ تجربہ 1 میں، ایمبیڈنگ بیاس کا اثر ایک حالت میں مثبت تھا ("حقیقت" اور "رپورٹ" کے درمیان فرق: 193 ms، 95% CrI [37, 357] ms)، اور دو اور تین حالات میں منفی (فرق" کے درمیان حقیقت" اور "رپورٹ": −105 ms, 95% CrI [−194, −18]ms)۔
تیسرا، ماڈل کی پیشین گوئیوں کے ساتھ اتفاق میں، پڑھنے کے اوقات مطابقت پذیر حالت میں غیر مطابقت پذیر حالت ( {{0}} سے زیادہ تھے۔{5}}83, 95% CrI [0.031, 0.136 ],P( <0)=0.0014؛ خام پڑھنے کے اوقات میں اثر: 96 ms, 95% CrI[36, 156] ms)۔ مزید تجزیوں کے لیے SI ضمیمہ، سیکشن S3 دیکھیں۔
نوٹ کریں کہ ایمبیڈنگ تعصب اور مطابقت کے اثرات عددی طور پر ان دو شرائط کے مقابلے تین حالات میں زیادہ ہوتے ہیں۔ ایک میٹا تجزیہ ظاہر کرتا ہے کہ یہ فرق اعداد و شمار کے لحاظ سے پڑھنے کے اوقات اور ماڈل کے پیرامیٹر اسپیس کے کچھ حصوں (SI اپنڈکس، سیکشن S2.1 اور S6.6) دونوں میں معنی خیز ہیں۔
COMPATIBLE اور INCOMPATIBLE کے درمیان سرایت کرنے والے تعصب کی ڈھلوان میں عددی فرق اعداد و شمار کے لحاظ سے معنی خیز نہیں تھے (SI Appendix, Fig. S23)، اور نہ ہی دو تجربات (SI Appendix, Fig. S6) کے درمیان ماڈل کی پیشین گوئیوں کے وقفے میں عددی فرق تھے۔
SI ضمیمہ دیکھیں، سیکشن S6 سابقہ پڑھنے کے وقت کے مطالعے سے ثبوت کو یکجا کرنے کے لیے (کل n=501)۔ ہم نے دو درجہ بندی کے مطالعہ (کل n=335؛ SI ضمیمہ، سیکشن S5) میں تفہیم پر سرایت کرنے والے تعصب کے اثر کو مزید نقل کیا۔
تجربہ 3: پیداوار کا مطالعہ
اب تک، ہم نے پڑھنے کے اوقات میں ماڈل کی پیشین گوئیوں کی تصدیق کی ہے۔ پڑھنے کے اوقات میں پیمائش کی جانے والی دشواری اس بات کی نشاندہی کرتی ہے کہ انسانوں کی توقعات کی خلاف ورزی ہوئی ہے، لیکن براہ راست اس بات کی نشاندہی نہیں کرتی ہے کہ انسانی توقعات کیا ہیں۔
انسانی توقعات کا دوسرا امتحان فراہم کرنے کے لیے، ہم نے ایک پروڈکشن پیراڈیم-کلوز تکمیل (40,41) کی طرف رجوع کیا جو کہ زبان کی تحقیق میں اس بات کا اندازہ کرنے کے لیے استعمال کیا گیا ہے کہ تمہید کے فوراً بعد کن الفاظ کی توقع کی جاتی ہے۔ ہم اس طریقہ کار کو کثیر الجہتی ساختوں کی پیچیدگی کا اندازہ کرنے اور اس بات کی پیمائش کرنے کے لیے استعمال کرتے ہیں کہ ایک پیچیدہ تمہید کے بعد انسان کتنے فعل کی توقع کرتا ہے۔*
ہم نے شرکاء سے کہا کہ وہ فارم کے سیاق و سباق کو مکمل کریں "رپورٹ کہ ڈاکٹر جو سفارت کار... حیرت انگیز، یا کم فعل والے غیر گراماتی ورژن، جیسے کہ "...بد اعتمادی حیران کن تھی۔" وسائل کی عقلی نقصان دہ سیاق و سباق سرپرائزل نے پیش گوئی کی ہے کہ اس طرح کی غیر گراماتی تکمیلات کی شرح زیادہ سرایت کرنے والے تعصب والے اسموں کے لیے کم ہونی چاہیے (مثال کے طور پر، "حقیقت")، کیونکہ یہ نامکمل یادداشت کی نمائندگی (تصویر 4A) سے حقیقی سیاق و سباق کو بازیافت کرنا آسان بناتے ہیں۔ موجودہ توقع پر مبنی اور میموری پر مبنی ماڈل یہ پیش گوئی نہیں کرتے ہیں کہ گرامر کی تکمیل کی شرح سرایت کرنے والے تعصب پر منحصر ہے۔

ہم نے 80 شرکاء کو بھرتی کیا۔ تصویر 4 نامکمل تکمیل کی شرح (تین فعل سے کم) کو ایمبیڈنگ تعصب کے فعل کے طور پر دکھاتا ہے۔ جیسا کہ پیش گوئی کی گئی ہے، غیر گراماتی ردعمل کی شرح پر سرایت کرنے کا اثر تھا (=−0.32, 95% CrI[−0.60, −0.05 ], P( > 0)=0.0123) ٹرائل بہ ٹرائل لاجسٹک مکسڈ اثرات کے تجزیہ میں۔
ہم نے اس مطالعہ کو مزید دو زبانوں (ہسپانوی اور جرمن) میں نقل کیا، جس میں ایک (جرمن) بھی شامل ہے جہاں سینٹر ایمبیڈنگ کی مشکل انگریزی (42) کے مقابلے میں کافی حد تک کمزور ہے۔

ہسپانوی میں، ہم نے کم فطری موضوع سے بچنے کے لیے موضوع کی متعلقہ شقوں (el hechode que el Director que، "حقیقت یہ ہے کہ ڈائریکٹر کون") کو نشانہ بنایا تاکہ کم فطری موضوع سے بچ سکیں۔ جرمن میں، ہم نے ایمبیڈڈ ڈھانچے کو نشانہ بنایا (مثال کے طور پر، Klaus hat erzahlt، ¨dass die Behauptung، dass der Student، den der پروفیسر، "کلاؤس نے کہا کہ یہ دعویٰ ہے کہ طالب علم جو پروفیسر ہے")، جیسا کہ یہ معلوم ہوتا ہے کہ وہ مشکل کی سطح کو قریب سے بڑھاتے ہیں۔ انگریزی (35)۔
ہم نے ہر زبان میں 60 شرکاء کو بھرتی کیا۔ دونوں زبانوں میں، ایمبیڈنگ کی شرح کا اثر منفی ہونے کا تخمینہ لگایا گیا تھا، جس کا تخمینہ اثر سائز انگریزی نتائج سے موازنہ کیا جا سکتا ہے (ہسپانوی:=−0.23, 95% CrI [−{{7 }}.34، −0.12]، P( > 0)< 0.0003; German: β = −0.28, 95% CrI [−0.56, −0.03], P(β > 0) = 0.01738). These results suggest that the-previously undocumented-effect of embedding bias on human expectations holds across different languages, even when they vary in the overall difficulty of center embeddings.
بحث
ہم نے انسانی زبان کی پروسیسنگ کا ایک ماڈل متعارف کرایا ہے جس میں وسائل کی عقلی پیشن گوئی کی گئی ہے، جس کو جدید مشین سیکھنے کے طریقوں کا استعمال کرتے ہوئے صوابدیدی ان پٹ تک بڑھایا گیا ہے۔ انسانی نحوی پروسیسنگ پر یادداشت اور توقع پر مبنی نقطہ نظر کو ہم آہنگ کرنے کا مقصد، یہ ماڈل نہ صرف ان ترجیحات کی پیشین گوئیوں کو بحال کرتا ہے جہاں وہ درست ہیں بلکہ یادداشت کی حدود اور امکانی توقعات کے درمیان پہلے سے غیر دستاویزی تعاملات کی بھی پیش گوئی کرتا ہے، جس کی تصدیق ہم نے تین طرز عمل کے تجربات میں کی ہے جو انسانی عمل کی دوبارہ جانچ پڑتال کرتے ہیں۔ ڈھانچے
ہمارے نتائج سے پتہ چلتا ہے کہ طویل لسانی انحصار کو یکجا کرنے کی اچھی طرح سے دستاویزی مشکل، جو کہ موجودہ میموری پر مبنی ماڈلز (5, 7, 36) کے مرکز میں ہے، کافی حد تک امکانی توقعات کے ذریعے وضع کی گئی ہے: theONE اور تین شرائط کے درمیان موازنہ ظاہر کرتا ہے کہ ایسی مقامی اثرات کمزور ہو سکتے ہیں یا اس سے بھی الٹ سکتے ہیں جب غیر مقامی نحوی ڈھانچے میں ترجیحی امکان زیادہ ہو، ایک ایسی پیشین گوئی جو قدرتی طور پر ہماری یادداشت کے مجوزہ اتحاد اور توقع پر مبنی نقطہ نظر سے خارج ہوتی ہے۔
ہمارا کام ایک ہی تجربے میں اور ایک ماڈل کے ساتھ نفسیاتی ادب کے اثرات کے تین نمایاں خاندانوں کو مزید دستاویز کرتا ہے: مقامی اثرات (تین میں سے مشکل میں اضافہ)، پیش گوئی کے اثرات (ایک حالت میں سرایت کرنے کا اثر)، اور معنوی مداخلت کے اثرات (معنی مطابقت کا اثر۔ )۔
اثرات کے ان خاندانوں کے ایک متفقہ نظریاتی علاج میں کافی دلچسپی رہی ہے۔ ہمارا کام یہ ظاہر کرتا ہے کہ ایک ماڈل کس طرح بیان کر سکتا ہے، تفصیل سے، وہ کیسے تعامل کر سکتا ہے۔ مظاہر کا ایک گروپ ہمارے تجربات کے ذریعے نشانہ نہیں بنایا گیا ہے مماثلت پر مبنی مداخلت (43، 44)۔ یہ تحقیق کرنا کہ آیا اس ماڈلنگ فریم ورک کے ساتھ اس کا حساب بھی لیا جا سکتا ہے مستقبل کی تحقیق کے لیے ایک دلچسپ مسئلہ ہے۔
ہمارا ریسورس ریشنل ماڈل باضابطہ طور پر مختلف ڈومینز کے ماڈلز سے متعلق ہے۔ کلاسیکی کام سے پتہ چلتا ہے کہ برقرار رکھنے کے امکانات کا عقلی تجزیہ انسانی یادداشت کی بنیادی خصوصیات کا سبب بن سکتا ہے (28, 29)۔ حالیہ کام (45-48) میں کچھ ڈومینز میں انسانی ورکنگ میموری کے باضابطہ ماڈلز ہیں، جیسے کہ بصری ورکنگ میموری، ریٹ ڈسٹورشن تھیوری، انفارمیشن تھیوریٹک فریم ورک کا استعمال کرتے ہوئے وسائل کی رکاوٹوں کے تحت ہائی فیڈیلیٹی انکوڈنگ حاصل کرنا۔
ریٹ – ڈسٹورشن تھیوری اور ہمارے ماڈل کے درمیان اہم فرق یہ ہے کہ اکانومی کا پیمانہ یہاں دستیاب الفاظ کا حصہ ہے، جبکہ یہ شرح – ڈسٹورشن تھیوری میں انکوڈڈ بٹس کی تعداد ہے۔ جملے کی تفہیم پر لاگو، شرح-تحریف کا نظریہ ماضی کے سیاق و سباق کی مکمل طور پر کمپریسڈ "جسٹ" نمائندگی کا باعث بنے گا۔ اس طرح کی مکمل طور پر کمپریسڈ نمائندگیاں ہمارے تجربات میں مشاہدہ کیے گئے مشکل نمونوں کی طرف نہیں لے جاتی ہیں (تفصیلات کے لیے SI ضمیمہ، سیکشن S8 دیکھیں)۔
دوسری طرف، ہمارا ماڈل اس لحاظ سے بھی ایک آسان ہے کہ یہ حالیہ سیاق و سباق کو الفاظ کی ترتیب کے طور پر پیش کرتا ہے، جو اس طویل سیاق و سباق کی میموری کی نمائندگی کے اصول کو کم کر سکتا ہے جہاں انفرادی الفاظ بھول گئے ہوں گے لیکن معنی کی یاد باقی ہے۔ مشین میں مزید ترقی سیکھنے سے وسائل کی عقلی اصلاح سے میموری کی نمائندگی کے زیادہ نفیس فارمیٹ کا اندازہ لگانے کی اجازت مل سکتی ہے۔
کمپیوٹر سائنس میں، تکراری ڈھانچہ عام طور پر اسٹیک پر مبنی ڈیٹا ڈھانچے کا استعمال کرتے ہوئے کارروائی کرتا ہے۔ اسی طرح، انسانی نحوی پروسیسنگ کے ابتدائی ماڈل اسٹیک کے سائز، یا نوڈس کی تعداد پر پابند ہیں جو ایک ہی وقت میں میموری میں رکھے جا سکتے ہیں (2، 24)۔
اس طرح کے ماڈل پیش گوئی کرتے ہیں کہ گہرائی میں سرایت کرنا زیادہ مشکل ہے، لیکن یہ پیش گوئی نہیں کرتے کہ مشکل کو شماریاتی یا معنوی اشارے کے ذریعے وضع کیا گیا ہے۔ اسٹیک پر مبنی فن تعمیر کے برعکس، ہمارا نظریہ تکراری ڈھانچے کو قائم کرنے میں امکانی اشاروں کو ایک اہم کردار تفویض کرتا ہے۔ اس سلسلے میں، یہ حال ہی میں میموری پر مبنی تھیوریوں سے اتفاق کرتا ہے کہ انسان ڈیٹا کے ڈھانچے کو برقرار نہیں رکھتے جیسے اسٹیک، اور، اس کے بجائے، ایسوسی ایٹیو کیو پر مبنی بازیافت (5, 7, 49, 50) کا استعمال کرتے ہوئے نحوی ڈھانچے قائم کرتے ہیں۔ جیسا کہ فی الحال لاگو کیا گیا ہے (7) مشکل کے مخصوص نمونوں کا حساب نہ دیں جس کی پیشن گوئی ہمارے ماڈل نے کی ہے اور ہمارے تجربات میں مشاہدہ کیا ہے۔ بہر حال، ہم اپنے نظریہ کو اس ادب کے نظریات سے ہم آہنگ سمجھتے ہیں۔
ہمارا نظریہ ایک کمپیوٹیشنل سطح کا ماڈل فراہم کرتا ہے جو پیشین گوئیوں کو موجودہ میموری پر مبنی ماڈلز کے ساتھ ہم آہنگ کرتا ہے، لیکن ان ماڈلز کے برعکس- عقلی طور پر زبان کے امیر شماریاتی ڈھانچے سے مطابقت رکھتا ہے، جس سے یہ اندازہ لگایا جا سکتا ہے کہ میموری کی حدود ممکنہ توقعات کے ساتھ کیسے تعامل کرتی ہیں۔ ہمارے نتائج بتاتے ہیں کہ یہاں بیان کردہ ریسورس ریشنل ماڈل کے الگورتھمک سطح کے نفاذ کے طور پر ایسوسی ایٹیو بازیافت ماڈل کے امکانی ورژن کی نشاندہی کرنا نفسیاتی تحقیق کے لیے ایک دلچسپ مسئلہ ہے۔ بازیافت پر مبنی میموری ماڈلز کے لیے ہمارے نتائج کے مضمرات کے بارے میں مزید جاننے کے لیے SI ضمیمہ، سیکشن S7.2 دیکھیں۔
توقع پر مبنی اور میموری پر مبنی ماڈلز کا ہمارا مجوزہ اتحاد اس خیال پر منحصر ہے کہ نامکمل کام کرنے والی میموری کی نمائندگی کو عقلی طور پر دوبارہ تشکیل دیا جاتا ہے-حالانکہ بعض اوقات زبان کے اعدادوشمار کے علم کو غلط استعمال کرتے ہوئے بھی۔ مثال کے طور پر، refs. 51-55)، ایک ایسا عمل جس کے ذریعے کم مدتی میموری کو لانگ ٹرم میموری سے علم کا استعمال کرتے ہوئے بحال کیا جاتا ہے۔ اس کا اطلاق ورڈ لسٹ کے لیے میموری پر کیا گیا ہے (مثلاً، حوالہ 52-55) اور، حال ہی میں، نحوی نمونوں کے لیے میموری (56)۔ ہمارا ماڈل اس طرح کے عمل کا ایک اکاؤنٹ فراہم کرتا ہے جو کہ وسائل کی معقولیت کی وجہ سے محدود Bayesian قیاس پر مبنی ہے۔ ایسے ماڈل بھی ہیں جہاں ورکنگ میموری کو اس کی اپنی میموری کے ایک جزو کے طور پر سمجھا جاتا ہے لیکن پروسیسنگ اور طویل مدتی میموری کے تعامل سے ابھرتا ہے (57, 58) ایسے ماڈلز کے لیے، ہمارے نتائج ڈیٹا فراہم کرتے ہیں کہ طویل مدتی علم پروسیسنگ کو کس طرح آگاہ کرتا ہے۔ .
ہمارے تجربات نحوی ڈھانچے کے اعداد و شمار کے ارتباط سے فائدہ اٹھاتے ہیں تاکہ یہ جانچ سکیں کہ ممکنہ توقعات میموری کی رکاوٹوں کے ساتھ کس طرح تعامل کرتی ہیں۔ اس میں پیشگی کام کی توقع پر مبنی ماڈلز میں کچھ مماثلتیں ہیں جو یہ ظاہر کرتی ہیں کہ کس طرح ارتباط، جیسے اینیمیسی اور رشتہ دار شق کی قسم کے درمیان، اثر پروسیسنگ کے طریقوں میں موجودہ میموری پر مبنی اکاؤنٹس (مثلاً، ریفریز 59-61) کے حساب سے نہیں ہیں۔ ہمارا کام میموری کی رکاوٹوں اور امکانی توقع کے درمیان تعامل کے ایک نافذ نظریہ کو بیان کرتے ہوئے کام کی اس لائن پر پھیلتا ہے۔
ہمارے ماڈل میں ایک مفت پیرامیٹر δ ہے، جو کہ برقرار رکھے گئے الفاظ کی اوسط تعداد ہے۔ ہم نے پیشین گوئیاں اخذ کرنے اور ان کا انسانی پڑھنے کے اوقات سے موازنہ کرنے میں ایک ہی قدر فرض کی۔ اسے انفرادی مضامین کے لیے موزوں کرنا اور انفرادی اختلافات کے قائم کردہ اقدامات سے اس کے تعلق کو سمجھنا مستقبل کی تحقیق کے لیے ایک دلچسپ مسئلہ ہے۔
انسانی نحوی پروسیسنگ کے کنکشنسٹ ماڈلز (8, 62-64) کا مقصد انسانی پروسیسنگ کو نیورل نیٹ ورک کی نمائندگی سے حاصل ہونے والی توقعات کا استعمال کرتے ہوئے بیان کرنا ہے اور انہیں میموری کی حدود اور امکانی توقعات دونوں سے متعلق ماڈل اثرات کی تجویز دی گئی ہے۔ تاہم، GPT-2 کے حساب سے سادہ سرپرائزل اور وسائل کے لحاظ سے نقصان دہ سیاق و سباق کے درمیان فرق یہ ظاہر کرتا ہے کہ کنکشنسٹ ماڈلز میں انسانی جیسی میموری کی حدود خود بخود ابھرنے کی ضرورت نہیں ہے۔
ہم نے دکھایا ہے کہ وسائل کے لحاظ سے لینگویج پروسیسنگ کے ماڈل کو قدرتی زبان کے امیر شماریاتی ڈھانچے تک کیسے پیمانہ کیا جا سکتا ہے۔ ہمارا مشین لرننگ پر مبنی طریقہ قدرتی اعداد و شمار اور انسانی ادراک کے دیگر شعبوں میں جدید ترین عقلی ماڈلز کو فٹ کرنے کا دروازہ کھول سکتا ہے۔
ہمارے ماڈل کی عمومیت یہ بھی بتاتی ہے کہ زبان سے باہر بھی اسی طرح کے مظاہر موجود ہو سکتے ہیں: جب بھی انسان پروسیسنگ ان پٹ پر کرتا ہے جو کہ اس کے تمام حصوں کے لیے بیک وقت شرکت کرنے کے لیے بہت پیچیدہ ہوتا ہے، تو پروسیسنگ کو اسی طرح کے آدانوں کے شماریاتی ڈھانچے سے متاثر ہونا چاہیے۔

مواد اور طریقے
اسم۔ ہم نے پین ٹری بینک (65)، انگلش ویب ٹری بینک (66)، ہسپانوی میں AnCoRA ٹری بینک (67)، اور جرمن میں HDT Treebank (68) کا استعمال کرتے ہوئے ایسے اسم جمع کیے جو ایک جذباتی تکمیل لے سکتے ہیں۔ ہم نے تخمینہ لگاتے ہوئے تعصب کو لاگو کرنے کے امکانات کا اندازہ لگایا کہ "NOUN" کے بعد "that" کا استعمال کرتے ہوئے انگریزی وکیپیڈیا (2.3 بلین الفاظ)، جرمن ویکیپیڈیا (800 ملین الفاظ) اور ہسپانوی ویکیپیڈیا (500 ملین الفاظ) کا استعمال کیا گیا۔ تفصیلات کے لیے SI ضمیمہ، سیکشن S11 ملاحظہ کریں۔
ماڈل۔ وسائل کی عقلی نقصان دہ سیاق و سباق کی حیرت کی تعریف ایک خاندان سے ہوتی ہے برقرار رکھنے کے امکانات θ={qw, i: i, w}، جہاں w کی حدیں الفاظ سے زیادہ ہوتی ہیں andi=1, ..., N، جہاں N=20 سیاق و سباق کی زیادہ سے زیادہ طوالت ہے، جو تجربات میں ظاہر ہونے والے تمام سیاق و سباق کو ایڈجسٹ کرنے کے لیے کافی ہے۔ امکان (SI ضمیمہ، سیکشن S1.1)۔ ماڈل θ امکان p(c|c) کو جنم دیتا ہے اور اس طرح پیچھے والا p(c|c)۔ اگلے لفظ کے بعد آنے والے p(w|c) کے لیے اوسط اگلے لفظ کی حیرت کو کم کرنے کے لیے منتخب کیا جاتا ہے:

ٹائم اسٹڈیز پڑھنے کے لیے تجرباتی سیٹ اپ۔ تمام مطالعات کے لیے، تجرباتی پروٹوکول کو سٹینفورڈ یونیورسٹی کے ادارہ جاتی جائزہ بورڈ نے منظور کیا تھا۔ تمام شرکاء سے باخبر رضامندی حاصل کی گئی۔
ہر شریک کو 10 تنقیدی آزمائشیں پیش کی گئیں۔ دونوں تجربات میں، دو آزمائشیں ایک میں تھیں، اور چار آزمائشیں دو اور تین میں تھیں۔ تجربہ 2 میں، دو اور تین ٹرائلز میں سے نصف مطابقت پذیر (غیر مطابقت پذیر) حالت میں تھے۔ ہم نے کام کے دوران مرکز میں سرایت کرنے کے اعداد و شمار کے موافقت کے کسی بھی اثر کو کم سے کم کرنے کے لیے، تنقیدی آزمائشوں کی ایک چھوٹی سی تعداد کا انتخاب کیا۔
اعداد و شمار کی درستگی کو زیادہ سے زیادہ کرنے کے لیے، ہم نے بہت زیادہ سرایت کرنے والے تعصب کے ساتھ 15 اسموں اور انتہائی کم سرایت کرنے والے تعصب کے ساتھ 15 اسموں کا انتخاب کیا (SI ضمیمہ، تصویر S36)۔ ہر شریک کے لیے، ہم نے پانچ اسموں کا نمونہ لیا جس میں زیادہ سرایت کرنے والے تعصب کے ساتھ اور کم قیمت والے پانچ اسم تھے اور ان کو 10 اہم آزمائشوں کے ساتھ ملایا۔ ہر شریک کے لیے، ہم نے سینٹر ایمبیڈنگز (42) کے پہلے پڑھنے کے وقت کے مطالعے سے 56 فلرز کے پول سے 30 فلرز کے نمونے بھی لیے۔
قیاس کی خلاف ورزیوں کی وجہ سے معنوی بے ضابطگیوں کو دور کرنے کے لیے (مثلاً، "حقیقت غلط تھی")، ہم نے اسموں کو انٹیلنگ (مثلاً، "حقیقت")، غیر جانبداری (مثلاً، "دعویٰ")، اور غیر متزلزل منفی (جیسے، " الزام") اسم، اور ان تینوں طبقوں میں سے ہر ایک کے ساتھ مطابقت کے لیے درجہ بند اشیاء (SI ضمیمہ، سیکشن S11)۔ ہر شریک کے لیے، ہم نے 10 اسموں کو معنوی طور پر ہم آہنگ اشیاء کے ساتھ ملایا۔
بھولبلییا کے کام کے لیے، ہم نے گلورداوا لینگویج ماڈل (69) کا استعمال کرتے ہوئے خود بخود ڈسٹریکٹرز (39) پیدا کیے: تعدد اور لمبائی میں ہدف والے لفظ کے ساتھ مماثل ہونے کے دوران ان ڈسٹریکٹرز کا سیاق و سباق کا امکان انتہائی کم ہے۔ -تجربہ 2 میں (IN) مطابقت پذیر حالات میں آخری فعل۔ خاص طور پر، خلفشار کو تمام شرائط میں تنقیدی لفظ پر ملایا گیا تھا۔
جب شرکاء نے غلطی کی (یعنی، ڈسٹریکٹر کا انتخاب کیا)، تو انہیں موجودہ لفظ (70) کو دوبارہ آزمانے کے لیے کہا گیا۔ اس طرح کی آزمائشوں پر ردعمل کے اوقات کو خارج کر دیا گیا تھا۔ اس انتخاب نے نتائج کو متاثر نہیں کیا (SI ضمیمہ، سیکشن S3.6)۔
ہر مضمون کے لیے، ٹرائلز کو بے ترتیب ترتیب میں پیش کیا گیا تھا تاکہ کوئی دو اہم آزمائشیں ملحق نہ ہوں۔ پرولفک اکیڈمک پلیٹ فارم پر بھرتی ہونے والے شرکاء نے 13 منٹ کا میڈین لیا اور £2.20 (≈3 USD) وصول کیا۔
پڑھنے کے اوقات کے لیے ڈیٹا کا تجزیہ۔ ہم نے ٹرائلز 1) غلط جواب کے ساتھ، 2) شرکاء سے جنہوں نے 20% سے زیادہ الفاظ میں غلطیاں کی ہیں، اور 3) پڑھنے کے تمام اوقات کے 99% سے نیچے یا اس سے زیادہ۔ شرط 1 کی مضبوطی کے لیے SI اپینڈکس، سیکشن S3.6 دیکھیں، اور حالت 3 میں مضبوطی کے لیے SI اپینڈکس، سیکشن S3.7 دیکھیں۔ ہتھیاروں کا استعمال (72)۔ SI ضمیمہ، سیکشن S3.3 پرائیرز کے لیے اور پہلے کے انتخاب میں مضبوطی دیکھیں۔ ہم نے تضادات کے طور پر "وہ" شق (ایک بمقابلہ دو/تین)، گہرائی (دو بمقابلہ تین)، اور مطابقت کی ہیرا پھیری (موازنہ بمقابلہ غیر مطابقت پذیر) کی موجودگی کے ساتھ کنٹراسٹ کوڈنگ کا استعمال کیا۔ ایمبیڈنگ تعصب مرکز میں تھا، اور تمام غیر خالی بائنری تعاملات کو فکسڈ اثرات کے طور پر شامل کیا گیا تھا (SI ضمیمہ، سیکشن S3.2)۔
ہم نے زیادہ سے زیادہ بے ترتیب اثرات کے ڈھانچے کو شامل کیا جو تجرباتی ڈیزائن، داخل ہونے والی اشیاء، اسم، اور شرکاء کو بے ترتیب اثرات کے طور پر جائز قرار دیتے ہیں۔ خام پڑھنے کے اوقات (ملی سیکنڈز) میں اثرات کا تخمینہ لگانے کے لیے، ہم نے پہلے پیش گوئی شدہ لاگ کو تبدیل شدہ پڑھنے کے وقت کو دونوں حالتوں میں شمار کیا (مثلاً، مطابقت پذیر اور غیر مطابقت پذیر)، پھر دونوں کو ایکسپوینٹیئبل کرکے ملی سیکنڈ میں تبدیل کیا، اور فرق کو شمار کیا (دیکھیں SI ضمیمہ، سیکشن S3.4 مزید تفصیلات کے لیے)۔ تصویر 3 میں، ہم "حقیقت" یا "رپورٹ" سے مماثل تعصب کے ساتھ جڑے ہوئے اسم کے لیے تمام حالات میں پیشین گوئی کے پڑھنے کے وقت کے بعد کا مطلب پیش کرتے ہیں۔ خرابی والی سلاخیں پچھلے SD کی نمائندگی کرتی ہیں۔
پروڈکشن اسٹڈی کے لیے تفصیلات۔ ہم نے فارم کی 28 آئٹمز "The XXXthat the diplomat who senator" کی تعمیر کی اور 12 اسموں کا انتخاب کیا، 6 ہر ایک بہت زیادہ انتہائی کم سرایت کرنے والے تعصب کے ساتھ۔ ہر شریک کے لیے، ہم نے تصادفی طور پر اشیاء اور اسموں کا جوڑا بنایا۔ 12 اہم آزمائشوں کو 27 فلرز کے ساتھ بے ترتیب ترتیب میں پیش کیا گیا۔ Alinguist نے دستی طور پر تشریح کی، فراہم کردہ ہر تکمیل کے لیے، آیا فعل کے فقروں کی صحیح تعداد (تین) تیار کی گئی تھی۔ تشریح کرنے والا اسم کی شناخت سے نابینا تھا۔
ہسپانوی اور جرمن میں، ہم نے ہر زبان میں بہت زیادہ یا بہت کم ایمبیڈنگ تعصب کے ساتھ 20 اسموں کا انتخاب کیا، ہر شریک کے لیے 6 اعلی اور 6 کم ایمبیڈنگ تعصب کے نمونے لیے۔ جیسا کہ انگریزی ورژن میں ہے، ہم نے تصادفی طور پر 12 آئٹمز کو ہر شریک کے لیے 12 نمونے والے اسم کے ساتھ ملایا۔ فلرز کا انگریزی تجربے سے ترجمہ کیا گیا تھا۔
جرمن میں، ہم نے مزید 12 میٹرکس جملے بنائے (مثال کے طور پر، "کلاؤس نے کہا")، اور تصادفی طور پر ان کو ہر شریک کے لیے آئٹمز اور اسم کے ساتھ ملایا۔ ہم نے ایک مقررہ اثر کے طور پر ایمبیڈنگ تعصب کے ساتھ ایک Bayesian ٹرائل بہ ٹرائل لاجسٹک مخلوط اثرات کا تجزیہ کیا۔ ، اور اسم، اشیاء، شرکاء، اور (جرمن میں) میٹرکس جملوں کے بے ترتیب اثرات۔ تفصیلات کے لیے SI ضمیمہ، سیکشن S4 دیکھیں۔
ڈیٹا، مواد، اور سافٹ ویئر کی دستیابی. فٹ برقرار رکھنے کے امکانات اور ماڈل کی پیشین گوئیاں Zenodo (https://zenodo.org/record/6602698) (73)، (https://zenodo.org/record/6988696) (74) میں جمع کر دی گئی ہیں۔ گمنام پڑھنے کے اوقات، زبان کی پیداوار کا ڈیٹا، اور سورس کوڈ GitLab (https://gitlab.com/m-hahn/resource-rational-surprisal) (75) میں جمع کر دیا گیا ہے۔
اعترافات۔ ہم ایڈیٹر اور جائزہ لینے والوں کا ان کے تعمیری تاثرات کے لیے شکریہ ادا کرتے ہیں، جس نے مخطوطہ کو بہتر بنانے میں مدد کی۔ ہم جوڈیتھ ڈیگن، تیوالیو ایزاپے، ہیلن ہاؤ، جینیفر ہو، ڈین جورافسکی، پینگ کیان، کوری شین، شراوان وسیشٹھ، ٹام واسو، ایتھن ولکوکس، اور 2020 کی CUNY کانفرنس آن سنٹینس پروسیسنگ میں مددگار گفتگو اور بیک بیک کے لیے ان کے بھی مشکور ہیں۔

حوالہ
1. N. چومسکی، Syntactic Structures (Mouton، The Hague، 1957)۔
2. جی اے ملر، این چومسکی، ریاضیاتی نفسیات کی ہینڈ بک میں "زبان استعمال کرنے والوں کے فنی ماڈلز"، آر ڈی لوس، آر آر بش، جی گیلانٹر، ایڈز۔ (جان ولی، 1963)، صفحہ 269–321۔
3. L. Frazier، "Syntactic complexity" in Natural Language Parsing: Psychological, Computational, and Theoretical Perspectives, DR Dowty, L. Karttunen, AM Zwicky, Eds. (کیمبرج یونیورسٹی پریس، نیو یارک، 1985)، صفحہ 129-189۔
4. ای گبسن، لسانی پیچیدگی: نحوی انحصار کی جگہ۔ ادراک 68، 1–76 (1998)۔
5. B. McElree, S. Foraker, L. Dyer, Memory Structures that subserve sentence comprehension.J. میم۔لینگ۔ 48، 67–91 (2003)۔
6. W. Tabor, B. Galantucci, DC Richardson, Effects of merely local syntactic coherence on sentenceprocessing.J. میم لینگ 50، 355–370 (2004)۔
7. RL Lewis, S. Vasishth, ایک ایکٹیویشن پر مبنی ماڈل جملہ پروسیسنگ کے بطور ہنر مند میموری بازیافت۔Cogn۔ سائنس 29، 375–419 (2005)۔
8. MH کرسٹیسن، MC میکڈونلڈ، ایک استعمال پر مبنی نقطہ نظر جملے کے عمل میں تکرار کے لیے۔Lang۔ سیکھیں۔ 59، 126–161 (2009)۔
9. J. Hale، (2001) "ایک ممکنہ ابتدائی تجزیہ کار بطور نفسیاتی ماڈل" ایسوسی ایشن فار کمپیوٹیشنل لسانیات کے نارتھ امریکن چیپٹر کی سیکنڈ میٹنگ کی کارروائی میں، NAACL 2001، L. لیون، کے نائٹ، ایڈز۔ (ایسوسی ایشن فار کمپیوٹیشنل لسانیات، اسٹروڈسبرگ، PA)، پی پی 1-8۔
10. آر لیوی، توقع پر مبنی نحوی فہم۔ ادراک 106، 1126–1177 (2008)۔
11. K. Rayner، AD ویسے، پڑھنے میں آنکھوں کی نقل و حرکت پر متعلقہ رکاوٹ کے اثرات: مزید جانچ۔ سائیکون بیل. Rev. 3، 504–509 (1996)۔
12. اے اسٹوب، پڑھنے میں آنکھوں کی نقل و حرکت پر لغوی پیش گوئی کا اثر: تنقیدی جائزہ اور نظریاتی تشریح۔ لینگ۔ ماہر لسانیات۔ کمپاس 9، 311–327 (2015)۔
For more information:1950477648nn@gmail.com






