کازل ڈسکوری الگورتھم کے ساتھ چیلنجز اور مواقع: الزائمر پیتھوفیسولوجی کے لیے درخواست

Feb 19, 2022

زن پینگ شین1*، سیسی ما1ET رحمہ اللہ تعالی


Causal Structure Discovery (cSD) کمپیوٹیشنل طریقوں کے ذریعے ڈیٹا کی ایک بڑی مقدار سے causal تعلقات کی شناخت کا مسئلہ ہے۔ روائتی ایسوسی ایشن پر مبنی کمپیوٹیشنل طریقوں کی محدود صلاحیت کے ساتھ وجہ تعلقات کو دریافت کرنے کے لیے، سی ایس ڈی کے طریقے مقبولیت حاصل کر رہے ہیں۔ مطالعہ کا مقصد منظم طریقے سے جانچنا تھا کہ آیا (i) سی ایس ڈی کے طریقے مشاہداتی طبی اعداد و شمار سے معلوم وجہ کے تعلقات کو دریافت کر سکتے ہیں اور (ii) معلوم وجہ کے تعلقات کو درست طریقے سے دریافت کرنے کے لیے رہنمائی پیش کرنا تھا۔ ہم نے استعمال کیاایک دماغی مرض کا نام ہے(AD)، ایک پیچیدہ ترقی پسند بیماری، ایک ماڈل کے طور پر کیونکہ اچھی طرح سے قائم شدہ شواہد تشخیص کے لیے "گولڈ اسٹینڈرڈ" کازل گراف فراہم کرتے ہیں۔ ہم نے دو سی ایس ڈی طریقوں کا جائزہ لیا، فاسٹ کازل انفرنس (FCI) اور فاسٹ گریڈی ایکوئیلنس سرچ (fGeS) کی طرف سے جمع کردہ ڈیٹا سے اس ڈھانچے کو دریافت کرنے کی صلاحیتایک دماغی مرض کا نام ہےنیورو امیجنگ اقدام (ADni)۔ ہم نے ساختی مساوات کے ماڈلز (جو cSD کے لیے ڈیزائن نہیں کیے گئے ہیں) کو بطور کنٹرول استعمال کیا۔ ہم نے ان طریقوں کو تین منظرناموں کے تحت لاگو کیا جس کی وضاحت طریقوں کو فراہم کردہ پس منظر کے علم کی بڑھتی ہوئی مقدار سے کی گئی ہے۔ طریقوں کا اندازہ "گولڈ اسٹینڈرڈ" گراف کے ساتھ نتیجہ خیز تعلقات کا موازنہ کرکے کیا گیا جو ادب سے بنایا گیا تھا۔ وقف شدہ سی ایس ڈی طریقے ایسے گرافس کو دریافت کرنے میں کامیاب ہوئے جو سونے کے معیار سے تقریباً ہم آہنگ تھے۔ بہترین نتائج کے لیے، سی ایس ڈی الگورتھم کو طول بلد ڈیٹا کے ساتھ استعمال کیا جانا چاہیے جو ممکن ہو زیادہ سے زیادہ پیشگی معلومات فراہم کرے۔

رابطہ:joanna.jia@wecistanche.com/ واٹس ایپ: 008618081934791

the effect of cistanche extract phenethanol glycosides on Alzheimer's

کا اثرcistanche اقتباسphenoxyethanol glycosides پرالزائمر

بڑے اعداد و شمار کے تجزیات، مشین لرننگ، اور گہری سیکھنے نے ہیلتھ سائنس فیلڈز 1,2 میں نمایاں دلچسپی حاصل کی ہے۔ ان کی بہترین پیشین گوئی کی درستگی کی وجہ سے، وہ بیماری کی تشخیص اور خطرے کی پیشین گوئی کے لیے تیزی سے کام کر رہے ہیں۔ تاہم، بہت سی بایومیڈیکل ایپلی کیشنز میں، خود اور بذات خود اعلیٰ پیشین گوئی کی درستگی کا حصول بنیادی مقصد نہیں ہے۔ خطرے کے عنصر یا طریقہ کار کو دریافت کرنا جسے تبدیل کیا جا سکتا ہے اکثر بنیادی تحقیقی سوال ہوتا ہے۔

آج کی مشین لرننگ ایپلی کیشنز زیادہ تر ایسوسی ایشنز پر مبنی ہیں۔ اگرچہ خطرے کا عنصر بیماری کے ساتھ منسلک ہوسکتا ہے، اس کا لازمی طور پر یہ مطلب نہیں ہے کہ یہ بیماری کے عمل کو تبدیل کرسکتا ہے۔ 2018 کے اوائل میں، "TOMORROW" نامی فیز 3 ٹرائل میں ذیابیطس کی دوا کے اثر کو کم کرنے پر جانچا گیا۔ایک دماغی مرض کا نام ہے(AD) ڈیمنشیا کا خطرہ 4۔ اس تحقیق میں امائلائیڈ کے جمع ہونے کی پیمائش کی گئی، جو کہ الزائمر کی بیماری کی ابتدائی علامت ہے اور اس کا تعلق ذیابیطس سے بھی ہے۔ تاہم، چونکہ ذیابیطس amyloidosis کا سبب نہیں ہے، اس لیے یہ مطالعہ عبوری تجزیہ 5,6 میں ناکام رہا۔ ایک کامیاب مداخلت کے لیے، ہم جس خطرے کے عنصر پر مداخلت کرتے ہیں اس کا اس کے ساتھ ایک سبب (صرف ہم آہنگی کے بجائے) تعلق ہونا چاہیے۔بیمارینتیجہ

کلینکل ریسرچ بنیادی طور پر causal تعلقات پر مرکوز ہے. مفروضے سے چلنے والی طبی تحقیق، مثال کے طور پر، اکثر وجوہ کی ساخت، بائیو مارکرز اور نتائج کے درمیان کازل تعلقات کا ایک مجموعہ فرض کرتی ہے، اور محققین ان رشتوں کے اثر کے سائز کا اندازہ لگاتے ہیں (مثلاً وجہ کا اندازہ)۔ اس طرح کی تحقیق میں، ایک نتیجہ اخذ کرنا درست ہے، کیونکہ پیشگی علم اس بات کی تصدیق کرتا ہے کہ تعلقات واقعی کارآمد ہیں۔ تاہم، جب وجہ کے بارے میں کوئی علم نہیں ہوتا ہے، تو خود کار سازی کی ساخت کو ڈیٹا سے ایک ایسے عمل کے ذریعے دریافت کرنے کی ضرورت ہوتی ہے جسے causal structure Discovery کہا جاتا ہے۔ عام طور پر استعمال ہونے والی لیکن غلط پریکٹس یہ ہے کہ جزوی کازل ڈھانچہ فرض کیا جائے اور ساختی مساوات ماڈل (SEM) جیسے طریقوں کا استعمال کرتے ہوئے فٹ شدہ ماڈل کے آؤٹ پٹ کے اعدادوشمار کی بنیاد پر اسے ایڈجسٹ کیا جائے۔


اس کام میں، AD بائیو مارکر کو بطور پیشن گوئی اور ادراک کو نتیجہ کے طور پر استعمال کرتے ہوئے، ہم نے کارآمد تعلقات کو دریافت کرنے کے لیے ایک بہترین طریقہ کا تعین کیا۔ ہم نے AD کو اس مسئلے کے لیے ایک ماڈل کے طور پر استعمال کیا کیونکہ AD بائیو مارکر کیسکیڈ کو اچھی طرح سے سمجھا جاتا ہے7 اور بنیادی پیش گوئوں کے درمیان کارآمد تعلقات کو بھی اچھی طرح سے خصوصیت دی گئی ہے کہ ایک "گولڈ اسٹینڈرڈ" گراف بنایا جا سکتا ہے۔ مزید، عوامی ڈیٹا سیٹایک دماغی مرض کا نام ہے← نیورو امیجنگ انیشیٹیو (ADNI) کے پاس وسیع طول بلد ڈیٹا دستیاب ہے جو اس مخطوطہ میں طے شدہ منظم موازنہ کے لیے موزوں ہے۔ یہاں، ہم اپنے "گولڈ اسٹینڈرڈ" گراف کے ساتھ، وقف شدہ وجہ دریافت الگورتھم اور SEM پر مبنی سرچنگ الگورتھم کے نتائج کا موازنہ کرنے پر توجہ مرکوز کرتے ہیں۔ ہم نے عام غلطیوں کے پیچھے کی وجہ کی بھی چھان بین کی اور ان کو روکنے کے طریقے بھی دریافت کیے۔ ان تجربات نے ہمیں مشاہداتی اعداد و شمار کا استعمال کرتے ہوئے وجہ ڈھانچے کو دریافت کرنے کے لیے رہنما خطوط فراہم کرنے کی اجازت دی۔

Cistanche Prevents Alzheimer's

Cistanche روکتا ہےالزائمر

پس منظر

causal ساخت دریافت الگورتھم.غیر رسمی طور پر، وجہ کو دو متغیرات X اور Y کے درمیان تعلق کے طور پر بیان کیا جاتا ہے اس طرح کہ X میں تبدیلی Y8 میں تبدیلی کا باعث بنتی ہے۔ ایسوسی ایشن اور وجہ کے درمیان اہم فرق الجھنے کی صلاحیت میں ہے۔ فرض کریں کہ X اور Y کے درمیان کوئی براہ راست causal رشتہ موجود نہیں ہے بلکہ ایک تیسرا متغیر Z X اور Y دونوں کا سبب بنتا ہے۔ اس صورت میں، اگرچہ X اور Y مضبوطی سے جڑے ہوئے ہیں، X کو تبدیل کرنے سے Y میں تبدیلی نہیں آئے گی۔ Z کو a کہا جاتا ہے۔ کنفاؤنڈر مزید رسمی طور پر، وجہ A اور B کے درمیان ایک براہ راست اثر ہے جو الجھنے کے لیے ایڈجسٹ کرنے کے بعد باقی رہتا ہے۔ الجھاؤ کا مشاہدہ یا غیر مشاہدہ کیا جاسکتا ہے (اویکت)۔

causal ڈھانچہ متغیرات کے ایک سیٹ کے درمیان causal تعلقات کا مجموعہ ہے، اور causal structure کی دریافت مشاہداتی ڈیٹا سے causal structure سیکھنے کا مسئلہ ہے۔ وقف کی وجہ سے ڈھانچہ دریافت کرنے والے الگورتھم موجود ہیں اور انہیں دو ذیلی قسموں میں الگ کیا جا سکتا ہے، رکاوٹ پر مبنی اور سکور پر مبنی۔ Te constraint پر مبنی الگورتھم مشروط آزادی کی رکاوٹوں کی بنیاد پر causal ڈھانچہ بناتے ہیں، جب کہ اسکور پر مبنی الگورتھم امیدواروں کے متعدد کازل گراف تیار کرتے ہیں، ہر ایک کو ایک اسکور تفویض کرتے ہیں، اور اسکور کی بنیاد پر حتمی گراف منتخب کرتے ہیں۔ اس مطالعہ میں، ہم نے ہر قسم سے ایک ممتاز الگورتھم کا انتخاب کیا: فاسٹ کازل انفرنس الگورتھم (FCI)، جو کہ ایک رکاوٹ پر مبنی الگورتھم ہے، اور فاسٹ گریڈی ایکوئیلنس سرچ (FGES)، جو کہ اسکور پر مبنی الگورتھم ہے۔ اختصار کے لیے، ہم FGES اور FCI کے لیے ایک اعلیٰ سطحی تفصیل دیتے ہیں۔ مزید تفصیلی وضاحت کے لیے، ہم قارئین کو حوالہ جات 9-11 کا حوالہ دیتے ہیں۔ دونوں طریقے مشاہدہ شدہ الجھاؤ کے لیے ایڈجسٹ کر سکتے ہیں اور الگورتھم میں سے ایک، ایف سی آئی، اویکت الجھاؤ کو دریافت کرنے کی کچھ صلاحیت رکھتا ہے۔

فاسٹ causal inference (fci)رکاوٹ پر مبنی causal دریافت الگورتھم کے پیچھے مرکزی تصور یہ خیال ہے کہ مختلف کازل ڈھانچے مختلف آزادی کے رشتوں کو ظاہر کرتے ہیں۔ مثال کے طور پر، causal رشتہ A→- B →C، کا مطلب ہے کہ متغیر A، C سے آزاد ہے، دوسری طرف، جب A →C←B، A، اور B آزاد ہیں (غیر مشروط طور پر)، لیکن منحصر مشروط بن جاتے ہیں پر C. Te بعد کے ڈھانچے کو "V" ڈھانچہ کہا جاتا ہے (جسے collider بھی کہا جاتا ہے) جس میں دوسرے causal تعلقات کے مقابلے میں ایک منفرد آزادی تعلق ہوتا ہے۔ درحقیقت، یہ ان "پرائمیٹو" میں سے ایک ہے جس کو FCI کی طرح رکاوٹ پر مبنی الگورتھم تلاش کرتا ہے۔

محدودیت پر مبنی طریقوں میں بھی ایف سی آئی کے لیے مخصوص ایک خصوصیت اس کی اویکت (غیر مشاہدہ شدہ) کنفاؤنڈرز کو دریافت کرنے کی صلاحیت ہے۔ یہ ایک اور قدیم، "Y" ساخت کے ذریعہ فعال کیا گیا ہے۔ چار متغیرات ایک "Y" ڈھانچہ کی وضاحت کرتے ہیں جب ان میں درج ذیل کازل تعلقات ہوتے ہیں: W1 → X ← W2 اور X → Y۔ "Y" ڈھانچے کے اندر، W1 اور W2 دونوں X پر Y مشروط سے آزاد ہیں۔ Tis مشروط آزادی X اور Y کے درمیان غیر ناپید کنفاؤنڈر کے امکان کو مسترد کرنے میں مدد کرتی ہے۔ دوسرے لفظوں میں، جب FCI کو "Y" ڈھانچہ ملتا ہے۔ گراف، X سے Y سے causal تعلق بے بنیاد ہونے کی ضمانت ہے۔ دوسری صورت میں، FCI فرض کرتا ہے کہ ممکنہ طور پر غیر مشاہدہ کنفاؤنڈرز موجود ہیں12۔

فاسٹ causal inference (FCI) الگورتھم۔ FCI مکمل طور پر منسلک غیر ہدایت شدہ گراف سے شروع ہونے والا ایک causal گراف بناتا ہے، اور ایسے کناروں کو ہٹاتا ہے جو مشروط طور پر آزاد متغیرات کو جوڑتے ہیں۔ دوسرے مرحلے میں، یہ "V" اور "Y" کے ڈھانچے کی نشاندہی کرکے کناروں کو اورینٹ کرتا ہے اور بقیہ کناروں کو قواعد کے ایک سیٹ کی بنیاد پر اورینٹ کرنے کی کوشش کرتا ہے جس کی تفصیل سے کہیں اور وضاحت کی گئی ہے۔

تیز لالچی مساوات کی تلاش (FGES) الگورتھم۔لالچی مساوات تلاش (GES) الگورتھم کے بھی دو مراحل ہیں۔ پہلا مرحلہ ایک ایسے گراف کے ساتھ شروع ہوتا ہے جس میں کوئی کنارہ نہیں ہوتا ہے (تمام متغیرات کے ایک دوسرے سے آزاد ہونے سے مطابقت رکھتا ہے) اور لالچ کے ساتھ واقفیت میں ایک وقت میں کناروں (انحصار) کو جوڑتا ہے جو Bayes انفارمیشن سکور 14 (BIC) کو کم سے کم کرتا ہے، جس کے لیے سزا کا امکان ہے۔ اوور فٹنگ کو کم کرنے کی پیچیدگی۔ GES پھر ایک ایک وقت میں کناروں کو ہٹاتا ہے جب تک کہ یہ BIC کو کم کرتا ہے۔ اس کام میں استعمال ہونے والا FGES10 الگورتھم صرف GES11,15 کا ایک "تیز" (متوازی) ورژن ہے۔ FCI کی طرح، FGES بھی اورینٹ کناروں کے لیے "V" ڈھانچے پر انحصار کرتا ہے۔ "V" ساخت کا مضمر امکان منفرد ہے جبکہ A → B → C، C → B → A، اور A ← BC کے امکانات ایک جیسے ہیں۔ اس طرح، FGES "V" ڈھانچے کو منتخب کرے گا جب یہ دوسرے ڈھانچے کے مقابلے میں زیادہ امکان ظاہر کرتا ہے۔


ساختی مساوات ماڈلنگ (SEM)۔سٹرکچرل ایکویشن ماڈلنگ (SEM) شماریاتی ماڈلز کا ایک خاندان ہے، جو کہ بنیادی وجہ ساخت کو دیکھتے ہوئے، ہر تعلق کے اثر کے سائز (اور دیگر اعدادوشمار بھی) کا اندازہ لگا سکتا ہے۔ ماڈل فٹ کے اعدادوشمار کو بہتر بنانے کے لیے SEM دیے گئے causal ڈھانچے میں ترمیم کی تجویز بھی دے سکتا ہے۔

اگرچہ SEM کو causal سٹرکچر کو دریافت کرنے کے لیے ڈیزائن نہیں کیا گیا تھا، لیکن SEM کی تجویز کردہ ترامیم کو گراف ڈھانچے کو "بہتر" کرنے کے لیے استعمال کرنا کوئی معمولی بات نہیں ہے۔ SEM کی تجویز کے مطابق ہر اعادہ میں، ایک کنارہ شامل کرتے ہوئے، اس خصوصیت کو تکراری طور پر ایک causal گراف بنانے کے لیے استعمال کیا جا سکتا ہے۔ ہم نے اس (غلط) تلاش کے طریقہ کو دو منظرناموں کے تحت لاگو کیا: (1) خالی گراف سے شروع (کازل دریافت)؛ اور (2) "گولڈ اسٹینڈرڈ" گراف سے 1 یا 2 کناروں کو حذف کرکے حاصل کردہ گراف سے شروع کرنا۔ نوٹ کریں کہ، اس مقالے کے دائرہ کار میں، ہم الگورتھم کی نمائندگی کرنے کے لیے "SEM" کی اصطلاح استعمال کرتے ہیں جو SEM کو کنارے کی تلاش کے لیے استعمال کرتا ہے، نہ کہ اثر کے سائز کا اندازہ لگانے کے لیے۔

الگورتھم کے درمیان کلیدی اختلافات۔ SEM اور FGES دونوں مرحلہ وار الگورتھم ہیں جو کناروں کو شامل یا حذف کر کے ساخت میں ترمیم کرتے ہیں۔ FGES کا سب سے بڑا فائدہ یہ ہے کہ یہ موجودہ ڈھانچے کو دوسرے "مساوی" ڈھانچے میں تبدیل کرکے تلاش کی جگہ کو بڑھاتا ہے۔ مثال کے طور پر، کنارے کو دیکھتے ہوئے، A → B A، B، اور C گرافس میں ہے۔ SEM C اور A یا C اور B کے درمیان ایک ڈائریکٹڈ ایج شامل کرنے کی کوشش کرے گا، جس سے چار امکانات حاصل ہوں گے۔ تاہم، FGES مزید امکانات پر غور کرتا ہے کیونکہ یہ موجودہ کنارے A → B کو A ←B میں بھی تبدیل کر سکتا ہے، جس سے چار اضافی ممکنہ ڈھانچے حاصل ہوتے ہیں۔

تلاش کرنے کی حکمت عملیوں کے علاوہ (اسکور پر مبنی رکاوٹ بمقابلہ)، FCI دیگر دو الگورتھم سے بھی مختلف ہے اس کے سبب کے بارے میں اس کے مفروضے میں: SEM اور FGES دونوں بغیر پیمائش کے کنفاؤنڈرز کے مفروضے کے تحت کام کرتے ہیں۔ دوسرے الفاظ میں، تمام الجھنے والے متغیرات کو ڈیٹاسیٹ میں ماپا جاتا ہے۔ تاہم، ایف سی آئی اس مفروضے میں نرمی کرتا ہے اور ایک بے بنیاد تعلق کی اطلاع صرف اس صورت میں دیتا ہے جب اسے "Y" ڈھانچہ کا سامنا ہوتا ہے17۔

FCI اور FGES الگورتھم Tetrad سافٹ ویئر پیکج (ورژن 6.5.4) میں نافذ کیے گئے ہیں۔ شکل 1 آؤٹ پٹ گراف میں مختلف کنارے کی اقسام کی تشریحات دکھاتا ہے۔ SEM کے لیے، ہم نے R پیکیج 'lavaan'18 استعمال کیا۔



طریقہ

ڈیٹا۔اس مضمون کی تیاری میں استعمال ہونے والے ڈیٹا سے حاصل کیا گیا تھا۔ایک دماغی مرض کا نام ہےنیورو امیجنگ انیشیٹو (ADNI) ڈیٹا بیس (adni.loni.usc.edu)۔ ADNI کا آغاز 2003 میں ایک پبلک پرائیویٹ پارٹنرشپ کے طور پر کیا گیا تھا، جس کی قیادت پرنسپل انویسٹی گیٹر مائیکل ڈبلیو وینر، ایم ڈی کر رہے تھے۔ ADNI کا بنیادی ہدف یہ جانچنا ہے کہ آیا سیریل میگنیٹک ریزوننس امیجنگ (MRI)، پوزیٹرون ایمیشن ٹوموگرافی (PET)، دیگر حیاتیاتی مارکر، اور طبی اور نیورو سائیکولوجیکل اسیسمنٹ کو ملا کر ہلکی علمی خرابی (MCI) کی ترقی کی پیمائش کی جا سکتی ہے۔الزائمربیماری(AD) 19۔ ADNI مطالعہ کے تین مراحل ہیں جہاں آخری، ADNI3، ابھی بھی جاری ہے۔ مطالعہ کے تمام شرکاء نے تحریری طور پر باخبر رضامندی فراہم کی، اور مطالعہ کے پروٹوکول کو ہر مقامی سائٹ کے ادارہ جاتی جائزہ بورڈ نے منظور کیا۔ تمام طریقوں کو متعلقہ رہنما خطوط اور ضوابط کے مطابق انجام دیا گیا۔ تازہ ترین معلومات کے لیے www.adni-info.org دیکھیں۔ IRB جائزہ کی ضرورت نہیں تھی کیونکہ ADNI ڈیٹا کی شناخت نہیں کی گئی ہے اور ڈاؤن لوڈ کے لیے عوامی طور پر دستیاب ہے۔ ہم نے اپنے مطالعہ کو پہلے دو پر مرکوز کیا: ADNI 1 اور ADNI 2/GO۔ اعداد و شمار سے نکالے گئے متغیرات ہیں fludeoxyglucose PET (FDG)، amyloid-beta (ABETA)، phosphorylated tau (PTAU)، apolipoprotein E (APOE) ε4 ایلیل؛ آبادیاتی معلومات: عمر، جنس، تعلیم (EDU)؛ اور AD (DX) پر تشخیص۔ جدول 1 ڈیٹا سیٹ کے خلاصہ کے اعدادوشمار پیش کرتا ہے۔ گمشدہ اقدار کے ساتھ ریکارڈز کو ہٹانے کے بعد، کم از کم ایک مکمل ریکارڈ کے ساتھ 1008 شرکاء باقی رہ گئے ہیں، اور 266 باقاعدہ دو سالہ فالو اپ وزٹ کے ساتھ۔

Figure 1. Te interpretation of edges

"گولڈ اسٹینڈرڈ" گراف۔AD بائیو مارکر جھرن کا وسیع پیمانے پر جائزہ لیا گیا ہے۔ دماغ میں ABETA کا جمع ہونا بیماری کے عمل میں ایک ابتدائی واقعہ ہے اور CSF ABETA میں کمی کے ذریعے پکڑا جاتا ہے۔ ABETA کے لیے ظاہر کیے گئے خطرے کے عوامل عمر اور APOE4 ایللیس کی تعداد 6,20,21 ہیں۔ ABETA نیچے کی طرف نیوروفائبریلری الجھنے کی تشکیل اور اس کے نتیجے میں نیوروڈیجنریشن کا سبب بنتا ہے، یہ دونوں FDG-PET22 اور PTAU اضافہ کے ذریعے CSF23 پر ماپا جانے والے میٹابولک dysfunction کے ذریعے پکڑے جاتے ہیں۔ دو مارکر FDG-PET اور CSF PTAU علمی خرابی یا تشخیص کے سب سے مضبوط پیش گو ہیں 24,25 (ABETA کے مقابلے میں)۔ تعلیم، علمی لچک کا ایک سروگیٹ، فرد کی علمی حیثیت کو متاثر کرتی ہے26۔ یہ سب ادب میں اچھی طرح سے قائم رشتے ہیں۔ ان میں سے کچھ انجمنوں پر اثرانداز ہونے والی جنس جیسی کمزور کازل ایسوسی ایشنز ہیں جن کو ہم نے الگورتھم کا اندازہ نہیں لگایا کیونکہ ان انجمنوں کا اثر "گولڈ اسٹینڈرڈ" گراف میں زیر غور اہم اثرات کے مقابلے میں بہت کم ہے۔ اوپر بیان کردہ تعلقات تصویر 2 میں دکھائے گئے ہیں۔

پس منظر کا علم اور کراس سیکشنل بمقابلہ طولانی ڈیٹا۔ان رشتوں کو محدود کرنے کے لیے جنہیں الگورتھم دریافت کر سکتے ہیں، پس منظر کا علم لازمی طور پر ہونا چاہیے یا نہیں ہونا چاہیے (ممنوعہ) کناروں کی صورت میں فراہم کیا جا سکتا ہے۔ اس مقالے میں، ہم نے پس منظر کے علم کے تین درجات کی وضاحت کی ہے: (سطح 1) کوئی علم نہیں: دریافت شدہ ڈھانچہ خالصتاً ڈیٹا کی عکاسی کرتا ہے۔ کوئی کنارہ ممنوع ہے. (سطح 2) معمولی پس منظر کا علم: (a) آبادیاتی متغیرات کے درمیان کناروں کی ممانعت ہے (حالانکہ ان کے درمیان تعلق باقی رہ سکتا ہے) (b) بائیو مارکر یا تشخیص سے آبادیاتی متغیرات کے کنارے ممنوع ہیں۔ (سطح 3)

Figure 2. Te

مطالعہ ڈیزائن.وجہ دریافت مطالعہ۔ ہم نے مطالعہ کے اس حصے کے لیے ANDI سے دو ڈیٹا سیٹ نکالے: ایک سنگل کراس سیکشنل تھا، اور ڈیٹا ہر شریک کے ذریعے کیے گئے بیس لائن وزٹ پر اکٹھا کیا گیا تھا۔ دوسرا طول البلد ہے، جہاں ہم نے دو کراس سیکشنز سے ڈیٹا شامل کیا: بیس لائن وزٹ، اور 24 مہینوں میں کیا گیا دورہ۔ گمشدہ ڈیٹا والے ریکارڈز کو مزید مطالعہ سے ہٹا دیا گیا۔

مضبوط نتائج پیدا کرنے کے لیے، شریک کی سطح پر کراس سیکشنل اور طول بلد ڈیٹا دونوں کو 100 بار بوٹسٹریپ کیا گیا۔ دس، تین الگورتھم، SEM، FCI، اور FGES کو جانچ کے لیے بوٹسٹریپ کے تمام نمونوں پر جانچا گیا، جس میں علم کی تین مختلف ڈگریوں کو شامل کیا گیا جو پچھلے حصے میں بیان کیے گئے تھے۔

Table 1. Characteristics for Continuous and Categorical Variables. N=1008.

SEM- بازیابی کا مطالعہ۔ چونکہ زیادہ تر محققین فرضی گراف کے ساتھ شروعات کریں گے اور کناروں کو شامل کرنے کے لیے صرف SEM کا استعمال کریں گے، اس لیے ہم نے اس فرضی استعمال کے معاملے کے تحت SEM کا بھی تجربہ کیا: ہم نے "گولڈ اسٹینڈرڈ" گراف سے ہر ایک کنارے اور کناروں کے ہر جوڑے کو حذف کر کے گراف کی ابتدا کی (قیاس کردہ)۔ ، اور پھر جانچ کی گئی کہ آیا SEM حذف شدہ کناروں کو پانچ سے زیادہ اعادہ کرنے کے بعد دوبارہ حاصل کر سکتا ہے۔ ہم نے اس مطالعے میں پانچ کا انتخاب کیا ہے کیونکہ پانچ بار سے زیادہ کنارے کے اضافے کا نتیجہ کم یاد کرنے والا گراف ہوگا۔

تشخیص میٹرکس طریقوں کی کارکردگی کا اندازہ لگانے کے لیے، ہم نے درج ذیل تشخیصی میٹرکس کی وضاحت کی۔ ایک کنارہ درست ہے، اگر اور صرف اس صورت میں جب وہی کنارہ "گولڈ اسٹینڈرڈ" گراف میں موجود ہو اور کنارے کی واقفیت "گولڈ اسٹینڈرڈ" گراف میں واقفیت کے ساتھ موافق ہو۔ ایک کنارہ نیم درست ہے، اگر اور صرف اس صورت میں جب وہی کنارہ "گولڈ اسٹینڈرڈ" گراف میں موجود ہو اور اس کی سمت بندی "گولڈ اسٹینڈرڈ" گراف میں کنارے کی صحیح سمت سے متصادم نہ ہو۔ اور آخر میں، ایک کنارہ غلط ہے اگر کنارے "گولڈ اسٹینڈرڈ" گراف میں موجود نہیں ہے یا اگر یہ موجود ہے لیکن اس کی واقفیت حقیقی واقفیت کے برعکس ہے۔

ہم درج ذیل میٹرکس پیش کریں گے:

1. درست، نیم درست، غلط کناروں کی تعداد

2. درستگی: الگورتھم کے ذریعہ رپورٹ کردہ تمام کناروں پر درست یا نیم درست کناروں کا تناسب

3. یاد کریں: "گولڈ اسٹینڈرڈ" گراف میں کناروں کا تناسب جو درست یا نیم درست طریقے سے رپورٹ کیا گیا ہے

4. واقعہ کی شرح: 100 بوٹسٹریپ رن کے نتیجے میں ملحقہ کا فیصد ظاہر ہوتا ہے




نتائج

causal دریافت مطالعہ. Te نے دریافت کیا کہ SEM، FCI، اور FGES الگورتھم کے ذریعے تین درجے پہلے کی "معلومات" کے ذریعے تیار کردہ کازل ڈھانچے اس حصے میں دکھائے گئے ہیں۔ عام غلطیوں کے پس پردہ میکانزم کا بحث کے سیکشن میں مزید جائزہ لیا جائے گا۔

تجربہ 1: پس منظر کی معلومات کے بغیر۔ تصویر 3 میں، ہم 100 بوٹسٹریپس کے نمونوں میں کم از کم 80 فیصد وقوع پذیری کی شرح کے ساتھ کناروں کو پیش کرتے ہیں (ہر کنارے کے قریب موجود Te نمبر)۔ وہ کنارے جو گولڈ اسٹینڈرڈ گراف میں نہیں تھے سرخ رنگ میں رنگے ہوئے ہیں۔ ہر گراف کے دائیں جانب نمبرز درستگی، یاد کرنا، اور صحیح، نیم درست، اور غلط کناروں کی تعداد ہیں جو 100 بوٹسٹریپ نمونوں پر اوسط ہیں۔ براہ راست موازنہ کو آسان بنانے کے لیے، متغیرات کو تقریباً یکساں طور پر رکھا گیا ہے: ایک ہی متغیر تینوں گراف میں ایک ہی رشتہ دار مقام پر قابض ہے۔ SEM "گولڈ اسٹینڈرڈ" گراف سے صرف دو درست کناروں کو بازیافت کرنے میں کامیاب تھا (اوسط درستگی کے ساتھ 0.24 اور یاد کریں 0.30)، جبکہ FCI اور FGES نے 8 میں سے 4 کناروں کو صحیح یا نیم درست طریقے سے پایا (پریزیشن 0.24 اور 0.44، اسی طرح 0.46 اور 0.6 کو یاد کریں)۔ FCI اور FGES دونوں نے کامیابی کے ساتھ جینیاتی متغیر APOE41 ABETA کے ساتھ، ABETA FDG کے ساتھ، اور FDG، PTAU کے ساتھ DX کے درمیان کارآمد تعلق کو کامیابی سے بازیافت کیا۔ تاہم، الگورتھم کچھ رشتوں کی سمت کا تعین کرنے میں ناکام رہے۔ ہم نے یہ بھی مشاہدہ کیا کہ تینوں الگورتھم نے بائیو مارکر سے ڈیموگرافک متغیرات کے کناروں کی اطلاع دی ہے جو یقینی طور پر غلطیاں ہیں (جیسے ABETA FCI کے گراف میں APOE42 کا سبب بنتا ہے)۔ یہ نوٹ کرنا ضروری ہے کہ کچھ اچھی طرح سے قائم رشتے جیسے عمر اور امائلائڈ کے ساتھ ساتھ تعلیم اور تشخیص کسی بھی گراف میں دریافت نہیں کیا گیا تھا جس میں پس منظر کا علم نہیں تھا۔

تجربہ 2: معمولی پس منظر کے علم کا اضافہ۔ شکل 4 معمولی پس منظر کے علم کو شامل کرتے ہوئے تین الگورتھم کے ذریعے دریافت کیے گئے کازل ڈھانچے کو پیش کرتا ہے: آبادیاتی متغیرات دوسرے آبادیاتی متغیرات کی وجہ سے نہیں ہو سکتے اور نہ ہی بائیو مارکر (مثلاً شرکت کنندہ کی عمر تعلیم یا ABETA کی سطح سے متاثر نہیں ہوتی ہے)۔ تصویر 4 کی ساخت تصویر 3 کے مشابہ ہے۔

اگرچہ تمام طریقوں سے متعدد غلطیاں ہوئیں، جب معمولی پس منظر کی معلومات شامل کی گئیں تو نمایاں بہتری آئی۔ SEM کے ذریعہ پائے جانے والے کچھ غلط اسباب دراصل "گولڈ اسٹینڈرڈ" میں بالواسطہ وجہ تعلقات ہیں۔ مثال کے طور پر، APOE42 سے DX تک کا اثر ایک بالواسطہ اثر ہے جو 'گولڈ اسٹینڈرڈ' گراف میں ABETA سے گزرتا ہے۔ تینوں الگورتھم نے ایج ABETA → DX دریافت کیا۔ اگرچہ ہمارے "گولڈ اسٹینڈرڈ" گراف میں یہ براہ راست وجہ اثر نہیں ہے، لیکن ABETA FDG میں کمی کے ساتھ ساتھ PTAU میں اضافے کا ایک عام سبب ہے اور FDG اور PTAU دونوں DX کی طرف لے جاتے ہیں۔ لہذا، ABETA اور DX کے اثر کی توقع کی جا سکتی ہے۔ ایف سی آئی اور ایف جی ای ایس دونوں نے PTAU اور DX کے درمیان غلط ہدایت والے کنارے کی اطلاع دی۔ ہم دیکھیں گے کہ اس غلطی کو طولانی ڈیٹا کا استعمال کرکے درست کیا گیا ہے۔ ایف سی آئی الگورتھم نے ایف ڈی جی کے ساتھ پی ٹی اے یو اور ڈی ایکس کے درمیان ناپید کنفاؤنڈرز کی بھی اطلاع دی، جو کہ دلچسپ مفروضے ہیں جن کے لیے مزید مطالعات کی ضرورت ہے۔ تین الگورتھم میں سے، SEM نے سب سے کم کارکردگی حاصل کی (Precision 0.31، recall 0.39) جبکہ FCI اور FGES نے اعلیٰ اور کافی حد تک اعلیٰ کارکردگی حاصل کی (FCI: 0.42 precision) اور 0.55 یاد کرنا؛ FGES {{10}}.71 درستگی اور 0.68 یاد کرنا)۔

تجربہ 3: طول بلد ڈیٹا اور معمولی پس منظر کے علم کا اضافہ۔ شکل 5 تین الگورتھم اور ان کی کارکردگی کے میٹرکس کے ذریعہ دریافت ہونے والے اکثر کناروں کو پیش کرتا ہے۔ گراف کی ترتیب پچھلے اعداد و شمار سے مختلف ہے کیونکہ وہ طول بلد ڈیٹا سیٹ پر بنائے گئے ہیں۔ بائیو مارکر یا تشخیص سے وابستہ تمام نوڈس دو بار ظاہر ہوتے ہیں: ایک بار ان کی بنیادی قدر کے ساتھ ('0 0' لاحقہ سے ظاہر ہوتا ہے)) اور ایک بار 24 ماہ میں ('0 سے ظاہر ہوتا ہے۔ 24' لاحقہ)۔ زیادہ تر اعداد و شمار پچھلے نتائج کے مقابلے میں مزید بہتر ہوئے اور FGES نے صرف ایک غلط کنارے کے ساتھ ایک گراف بازیافت کیا۔

SEM الگورتھم کی کارکردگی دیگر دو سرشار وجہ دریافت الگورتھم سے پیچھے ہے۔ بوٹسٹریپ رنز میں سے کچھ میں، SEM ایک ہی بائیو مارکر کی طولانی پیمائش کے درمیان براہ راست اثرات سے محروم رہا (مثال کے طور پر SEM کا ایج ABETA دریافت کرنے کا تخمینہ امکان۔{0}} →ABETA.24 0.47 ہے جہاں FCI اور FGES ہمیشہ اس کنارے کو شامل کرتا ہے)۔

FCI الگورتھم نے مزید نشاندہی کی کہ ابتدائی دورے میں PTAU کا 24 ماہ میں تشخیص (AD) پر اثر پڑتا ہے۔ دوسرے لفظوں میں، PTAU کا AD کی تشخیص پر اثر پڑ سکتا ہے جو کہ ایک انتہائی قابل فہم مفروضہ ہے۔ ہم نے یہ بھی مشاہدہ کیا کہ AGE اور EDUCATION پہلے وزٹ پر مختلف FDG اور تشخیص کا باعث بنتے ہیں، لیکن 24 ماہ میں براہ راست تشخیص تک نہیں (بیس لائن وزٹ پر تشخیص کو ایڈجسٹ کرنے کے بعد)۔

FGES الگورتھم نے طول بلد ڈیٹا کو شامل کیا اور FDG سے DX کنارے کو کامیابی سے دریافت کیا۔ اس نے DX سے PTAU تک کے غلط کناروں کو بھی ہٹا دیا۔ مزید برآں، طولانی اعداد و شمار کے ساتھ، FGES کے ذریعے شناخت کیے گئے پہلے غیر ہدایت شدہ کناروں کو مجموعی درستگی اور یادداشت پر سمجھوتہ کیے بغیر ہدایت کی گئی۔

ایس ای ایم ریکوری اسٹڈی۔جدول 2 اعداد و شمار کو ظاہر کرتا ہے جب ہم نے "گولڈ اسٹینڈرڈ" گراف سے حذف شدہ کناروں کو بازیافت کرنے کی SEM کی صلاحیت کا تجربہ کیا۔ ہر رن میں، ہم نے ایک کنارہ یا کناروں کا ایک جوڑا حذف کیا۔ Te "مکمل طور پر بازیابی کی شرح" رنز کے فیصد کی نمائندگی کرتی ہے جس میں SEM حذف شدہ کنارے کو مکمل طور پر بحال کرنے میں کامیاب ہوا۔ Te "precision" اور "recall" کالم اسی طرح بیان کیے گئے ہیں جیسے پچھلے تجربات میں۔ جیسا کہ ہم جدول 2 سے دیکھ سکتے ہیں، جب ہم نے صرف ایک کنارے کو ہٹا دیا، تو بحالی کی شرح بہت کم ہے (12.5 فیصد)۔ جب ہم نے "گولڈ اسٹینڈرڈ" گراف سے دو کناروں کو ہٹایا، تو SEM صحیح گراف کو بازیافت کرنے سے قاصر تھا۔


بحث

اس مطالعے میں، ہم نے "علم" کی تین مختلف ڈگریوں کا استعمال کرتے ہوئے ایک مشاہداتی ڈیٹاسیٹ کی بنیاد پر معلوم زمینی سچائی کی وجہ ساخت کو دوبارہ بنانے کے لیے تین مختلف طریقوں کا موازنہ کیا۔ ہم نے استعمال کیاایک دماغی مرض کا نام ہےADNI کا ڈیٹا جو کہ ایک اچھی خصوصیات والا کھلے عام قابل رسائی ڈیٹا سیٹ ہے۔ چونکہ میں بائیو مارکر اور تشخیص کے درمیان تعلقاتایک دماغی مرض کا نام ہےاچھی طرح سے سمجھا جاتا ہے، ہم نے موجودہ لٹریچر کی بنیاد پر "گولڈ اسٹینڈرڈ" کازل ڈھانچہ کے ساتھ آغاز کیا۔ دس، ہم نے ڈیٹا سے اس کازل ڈھانچے کو دریافت کرنے کے لیے تین الگورتھم لگائے۔ یہ کام مختلف الگورتھم کی طرف سے کی گئی عام غلطیوں کو نمایاں کرتا ہے اور ہمیں ان غلطیوں سے بچنے کے لیے خیالات اور تجاویز پیش کرتا ہے۔ آخر میں، اس بارے میں ایک تفصیلی رہنما خطوط فراہم کیے گئے ہیں کہ کس طرح ایک causal Discovery algorithm کو اعلی معیار کے causal تعلقات کو دریافت کرنے کے لیے لاگو کیا جا سکتا ہے۔

اس کام میں استعمال ہونے والے تین الگورتھم میں سے ہر ایک الگورتھم کی ایک کلاس کو اپنی مخصوص خصوصیات کے ساتھ ظاہر کرتا ہے۔ الگورتھم میں سے دو، FCI اور FGES، وقف شدہ وجہ دریافت الگورتھم ہیں، جب کہ تیسرا، SEM، بنیادی طور پر ایک تصدیقی ٹول کے طور پر ڈیزائن کیا گیا ہے۔ Te dedicated causal Discovery algorithms نے پس منظر کے علم کی تینوں ڈگریوں میں SEM کو پیچھے چھوڑ دیا۔ یہ حیرت کی بات نہیں ہے، کیونکہ SEM خاص طور پر وجہ ساخت کو دریافت کرنے کے لیے ڈیزائن نہیں کیا گیا ہے۔ SEM کے ذریعہ رپورٹ کردہ اعدادوشمار صرف ایک ترجیحی صارف کی طرف سے متعین وجہ ساخت میں ممکنہ ایڈجسٹمنٹ کی نشاندہی کرتے ہیں۔ حیران کن بات یہ ہے کہ کس حد تک FGES نے SEM کو پیچھے چھوڑ دیا، کیونکہ FGES اور SEM دونوں ایک ہی معیار کو بہتر بناتے ہیں، جو BIC ہے۔ FGES اور SEM کے درمیان کلیدی فرق بنیادی تلاش کی جگہ کا پیمانہ ہے: FGES گرافس کی ایک وسیع صف پر غور کرتا ہے، تمام گرافس جن کا انحصار ڈھانچہ ایک ہی ہے (متغیر کے درمیان مشروط آزادی کے تعلقات کا ایک ہی مجموعہ)۔ SEM- بازیابی کے تجربے سے، ہم نے یہ بھی مشاہدہ کیا کہ SEM کی جانب سے کناروں کو شامل کرنے کی تجاویز عام طور پر قابل اعتماد نہیں ہیں۔ یہ کنارے SEM کی محدود تلاش کی جگہ میں BIC کو زیادہ سے زیادہ کر سکتے ہیں، لیکن یہ مجموعی طور پر بہترین کنارے نہیں ہیں: FGES، اپنی بڑی تلاش کی جگہ کے ساتھ، "گولڈ اسٹینڈرڈ" گراف کو (تقریباً مکمل طور پر) بازیافت کرنے میں کامیاب ہوا۔

FCI اور FGES کے پاس ایک جیسی تلاش کی جگہیں ہیں، ان کے درمیان بنیادی فرق ان کی تلاش کے الگورتھم میں ہے۔ اسکور پر مبنی الگورتھم FGES کی کارکردگی زیادہ تھی اور ہمارے مطالعے میں رکاوٹ پر مبنی الگورتھم FCI سے زیادہ مستحکم تھی۔ FCI کی فیصلہ سازی انتخابی تعصب یا ڈیٹا کے نمونے کے ذریعے متعارف کرائے گئے غلط آزادی ٹیسٹوں سے متاثر ہوئی۔ یہ غلطیاں گراف کے دوسرے حصوں میں غلط "V" یا "Y" ڈھانچے کے ذریعے پھیلتی ہیں اور آخر کار گراف کے بڑے حصوں کو نقصان پہنچاتی ہیں۔ اس کے برعکس، سکور پر مبنی الگورتھم مقامی فیصلے کرتے وقت عالمی ڈھانچے کے امکانات پر غور کرتے ہیں۔ لہذا، یہ غلطیاں مقامی رہیں۔ یہ بتاتا ہے کہ FGES کا دریافت شدہ ڈھانچہ ٹریویا علم کو شامل کرنے سے پہلے یا بعد میں کیوں زیادہ مطابقت رکھتا ہے۔ ایف سی آئی کو یہ فائدہ ہے کہ وہ عام مفروضے کو آرام دہ بنا سکتا ہے جو کہ بغیر پیمائش کے کنفاؤنڈرز ہیں۔ یہ نرمی اس وقت کارآمد ثابت ہوسکتی ہے جب یا تو ناپختہ کنفاؤنڈرز کی نشاندہی کرنا یا بے بنیاد کازل تعلقات کو فنڈ دینا ضروری ہے۔ ہمارے مطالعے میں، FCI نے پایا کہ ABETA سے FDG کا تعلق غیر متزلزل ہے اور یہ کہ FDG, DX (تصویر 4-FCI) کے درمیان غیر پیمائشی کنفاؤنڈرز موجود ہو سکتے ہیں۔

ہم نے FCI اور FGES کی غلطیوں کی مزید چھان بین کی۔ ہم نے ان غلطیوں کو تین زمروں میں گروپ کیا اور ان کی وجوہات اور حل کو جدول 3 میں بیان کیا۔



1. پہلی قسم کی خرابی اس وقت ہوتی ہے جب ڈیٹا میں موجود نمونے غلط کناروں کو دلاتے ہیں۔ مثال کے طور پر، FCI نے EDU اور SEX (تصویر 3-FCI) کے درمیان ایک کنارے کی اطلاع دی، کیونکہ، ہمارے نمونے میں، مرد شرکاء کی اوسط تعلیم کی سطح زیادہ ہے۔ اس طرح کے غلط کناروں سے بچنا ضروری ہے کیونکہ وہ ممکنہ طور پر غلط "V" یا "Y" ڈھانچے بنا سکتے ہیں جو بقایا وجہ دریافت کے مراحل کو خطرے میں ڈال سکتے ہیں۔ پس منظر کے بارے میں معمولی معلومات کو شامل کرنے سے الگورتھم کو ایسوسی ایشن کا سبب سمجھنے سے روک کر اس مسئلے کو حل کیا جا سکتا ہے۔

2. جب عالمی طور پر قبول شدہ پس منظر کا علم دستیاب نہیں ہوتا ہے، تو اعداد و شمار کے نمونوں کی تلافی کرنا زیادہ مشکل ہوتا ہے اور اس کے بہت دور کے بہاو اثرات ہو سکتے ہیں۔ مثال کے طور پر، APOE42-PTAU-FDG ڈھانچہ کا اندازہ کچھ بوٹسٹریپ رن میں "V" ڈھانچہ (APOE42 → PTAU ←FDG) کے طور پر لگایا گیا تھا۔ یہ خرابی نمونے کے ڈیٹا سے APOE42 اور FDG کے درمیان ایک واحد غلط اندازے کی آزادی کا نتیجہ تھی۔ یہ خرابی (1) APOE42 اور PTAU، (2) PTAU اور FDG، اور (3) PTAU پر APOE42 اور FDG مشروط کے درمیان تین ایسوسی ایشنز کے ذریعے پھیلی، جس کی وجہ سے تینوں کے درمیان ایک "V" ڈھانچہ پیدا ہوا۔ ہم پس منظر کے علم کا استعمال کرتے ہوئے اس کنارے کو نہیں روک سکتے جب تک کہ ہمیں APOE42 اور FDG کے درمیان مشروط آزادی کے تعلقات کو پہلے سے معلوم نہ ہو۔ طولانی اعداد و شمار کے استعمال نے ان غلطیوں کو درست کرنے میں مدد کی۔ جیسا کہ ہم تصویر میں دیکھ سکتے ہیں۔ 5-FCI، جب طول البلد ڈیٹا استعمال کیا گیا تو ذیلی ساخت کو درست کیا گیا۔

3. اگرچہ طول البلد اعداد و شمار بہت سے مسائل کا حل فراہم کرتے ہیں، بار بار مشاہدے کی ضرورت نمونے کے سائز کو محدود کر سکتی ہے اور اس کی اپنی کچھ غلطیاں پیش کر سکتی ہے۔ مثال کے طور پر، FCI نے PTAU کے درمیان وقت 0 اور DX کے درمیان 24 مہینے میں ایک ممکنہ وقفے کا رشتہ دریافت کیا (تصویر 5-FCI)، تاہم، FGES (تصویر 1) کے نتائج میں وہی تعلق نہیں دیکھا گیا ہے۔ 5-FGES)-ممکنہ طور پر چھوٹے نمونے کے سائز کی وجہ سے۔

طول البلد مطالعہ میں، وقتی مقامات پر مقامی ڈھانچے ایک جیسے ہونے کی ضمانت نہیں دی جاتی ہے۔ مثال کے طور پر، FGES کے دریافت کردہ گراف میں، ABETA{{0}} PTAU کا سبب بنتا ہے۔{4}} لیکن ABETA.24 PTAU.24 کا سبب نہیں بنتا ہے۔ وجہ یہ ہے کہ ABETA۔{6}} ABETA.24 اور PTAU کا مشترکہ والدین ہے۔{9}}۔ PTAU.24 مشروط طور پر ABETA.24 سے آزاد ہے یا تو ABETA۔{10}} یا PTAU۔{12}}۔ اس مشروط آزادی تعلق کا مطلب یہ ہے کہ ABETA.0 یا PTAU.0 کی موجودگی میں، PTAU.24 میں تغیر کی وضاحت کے لیے ABETA.24 کی ضرورت نہیں ہے۔

اگرچہ مشاہداتی اعداد و شمار سے سیکھا گیا حتمی گراف "گولڈ اسٹینڈرڈ" گراف سے قریب سے مماثل ہے، ہمارے نتائج اب بھی "گولڈ اسٹینڈرڈ" کی درستگی پر منحصر ہیں۔ عام طور پر، ہمیں "گولڈ اسٹینڈرڈ" گراف پر بہت زیادہ اعتماد ہے کیونکہ AD بائیو مارکر کیسکیڈ کے پیچھے موجود حیاتیاتی طریقہ کار کو اچھی طرح سے سمجھا جاتا ہے اور FGES تقریباً مکمل طور پر "گولڈ اسٹینڈرڈ" کو دریافت کرنے میں کامیاب رہا۔ تاہم، یہ بہت ممکن ہے کہ FDG اور PTAU صرف AD کی تشخیص پر ABETA کے اثر کے کچھ حصے کی وضاحت کریں۔ DX پر ABETA سے براہ راست وجہ موجود ہو سکتی ہے۔ اگرچہ ہم طول البلد ڈیٹا کی تجویز کرتے ہیں، لیکن طول بلد ڈیٹا اکٹھا کرنا اکثر مہنگا ہوتا ہے جس کے نتیجے میں نمونے کا سائز چھوٹا ہوتا ہے۔ ایک چھوٹا نمونہ سائز کازل ڈسکوری الگورتھم میں شماریاتی طاقت کو کم کرتا ہے جو کہ ایک تجارت ہے۔ ہم نے نمونے کے سائز کو 50 فیصد اور 75 فیصد تک کم کرنے کی کوشش کی اور وہی تجزیہ کیا۔ جب ہم نے نمونے کے سائز کو 50 فیصد تک کم کیا تو 100 بوٹسٹریپ تکرار میں دریافت شدہ کناروں کی کل تعداد کم ہو گئی۔ تاہم، مکمل نمونے پر مستقل طور پر دریافت کیے گئے کناروں کو کم کیے گئے نمونے پر بھی مستقل طور پر دریافت کیا گیا۔ ہم نے اسی طرح کی درستگی اور یاد حاصل کی۔ جب ہم نے نمونے کے سائز کو مزید کم کیا (مجموعی طور پر 75 فیصد)، کناروں کی کل تعداد مزید کم ہوگئی۔ جب کہ کثرت سے دریافت ہونے والے کناروں کی دریافت ہوتی رہی، "شور کے کناروں" کی تعداد میں اضافہ ہوتا گیا، ایسے کناروں جو صرف چند بوٹسٹریپ تکرار میں دریافت ہوئے تھے۔

آخر میں، وقف شدہ causal دریافت الگورتھم نے causal ڈھانچہ دریافت کرنے میں SEM کو پیچھے چھوڑ دیا۔ حقیقی دنیا کے ڈیٹا کے تجزیہ میں، ڈیٹا کے معیار نے دریافت شدہ ڈھانچے کی درستگی کو متاثر کیا۔ پیشگی معلومات کو شامل کرنا اور طولانی ڈیٹا کا استعمال الگورتھم کو کچھ ممکنہ غلطیاں کرنے سے روک کر دریافت شدہ نتیجہ کو بہتر بنا سکتا ہے۔

1. پہلی قسم کی غلطی اس وقت ہوتی ہے جب ڈیٹا میں موجود نمونے غلط کناروں کو دلاتے ہیں۔ مثال کے طور پر، FCI نے EDU اور SEX (تصویر 3-FCI) کے درمیان ایک کنارے کی اطلاع دی، کیونکہ، ہمارے نمونے میں، مرد شرکاء کی اوسط تعلیم کی سطح زیادہ ہے۔ اس طرح کے غلط کناروں سے بچنا ضروری ہے کیونکہ وہ ممکنہ طور پر غلط "V" یا "Y" ڈھانچے بنا سکتے ہیں جو بقایا وجہ دریافت کے مراحل کو خطرے میں ڈال سکتے ہیں۔ پس منظر کے بارے میں معمولی معلومات کو شامل کرنے سے الگورتھم کو ایسوسی ایشن کا سبب سمجھنے سے روک کر اس مسئلے کو حل کیا جا سکتا ہے۔

2. جب عالمی طور پر قبول شدہ پس منظر کا علم دستیاب نہیں ہوتا ہے، تو اعداد و شمار کے نمونوں کی تلافی کرنا زیادہ مشکل ہوتا ہے اور اس کے بہت دور کے بہاو اثرات ہو سکتے ہیں۔ مثال کے طور پر، APOE42-PTAU-FDG ڈھانچہ کا اندازہ کچھ بوٹسٹریپ رن میں "V" ڈھانچہ (APOE42 → PTAU ←FDG) کے طور پر لگایا گیا تھا۔ یہ خرابی نمونے کے ڈیٹا سے APOE42 اور FDG کے درمیان ایک واحد غلط اندازے کی آزادی کا نتیجہ تھی۔ یہ خرابی (1) APOE42 اور PTAU، (2) PTAU اور FDG، اور (3) PTAU پر APOE42 اور FDG مشروط کے درمیان تین ایسوسی ایشنز کے ذریعے پھیلی، جس کی وجہ سے تینوں کے درمیان ایک "V" ڈھانچہ پیدا ہوا۔ ہم پس منظر کے علم کا استعمال کرتے ہوئے اس کنارے کو نہیں روک سکتے جب تک کہ ہمیں APOE42 اور FDG کے درمیان مشروط آزادی کے تعلقات کو پہلے سے معلوم نہ ہو۔ طولانی اعداد و شمار کے استعمال نے ان غلطیوں کو درست کرنے میں مدد کی۔ جیسا کہ ہم تصویر میں دیکھ سکتے ہیں۔ 5-FCI، جب طول البلد ڈیٹا استعمال کیا گیا تو ذیلی ساخت کو درست کیا گیا۔

3. اگرچہ طول البلد اعداد و شمار بہت سے مسائل کا حل فراہم کرتے ہیں، بار بار مشاہدے کی ضرورت نمونے کے سائز کو محدود کر سکتی ہے اور اس کی اپنی کچھ غلطیاں پیش کر سکتی ہے۔ مثال کے طور پر، FCI نے PTAU کے درمیان وقت 0 اور DX کے درمیان 24 مہینے میں ایک ممکنہ وقفے کا رشتہ دریافت کیا (تصویر 5-FCI)، تاہم، FGES (تصویر 1) کے نتائج میں وہی تعلق نہیں دیکھا گیا ہے۔ 5-FGES)-ممکنہ طور پر چھوٹے نمونے کے سائز کی وجہ سے۔

طول البلد مطالعہ میں، وقتی مقامات پر مقامی ڈھانچے کے ایک جیسے ہونے کی ضمانت نہیں ہے۔ مثال کے طور پر، FGES کے دریافت کردہ گراف میں، ABETA{{0}} PTAU کا سبب بنتا ہے۔{4}} لیکن ABETA.24 PTAU.24 کا سبب نہیں بنتا ہے۔ وجہ یہ ہے کہ ABETA۔{6}} ABETA.24 اور PTAU کا مشترکہ والدین ہے۔{9}}۔ PTAU.24 مشروط طور پر ABETA.24 سے آزاد ہے یا تو ABETA۔{10}} یا PTAU۔{12}}۔ اس مشروط آزادی تعلق کا مطلب یہ ہے کہ ABETA.0 یا PTAU.0 کی موجودگی میں، PTAU.24 میں تغیر کی وضاحت کے لیے ABETA.24 کی ضرورت نہیں ہے۔

اگرچہ مشاہداتی اعداد و شمار سے سیکھا گیا حتمی گراف "گولڈ اسٹینڈرڈ" گراف سے قریب سے مماثل ہے، ہمارے نتائج اب بھی "گولڈ اسٹینڈرڈ" کی درستگی پر منحصر ہیں۔ عام طور پر، ہمیں "گولڈ اسٹینڈرڈ" گراف پر بہت زیادہ اعتماد ہے کیونکہ AD بائیو مارکر کیسکیڈ کے پیچھے موجود حیاتیاتی طریقہ کار کو اچھی طرح سے سمجھا جاتا ہے اور FGES تقریباً مکمل طور پر "گولڈ اسٹینڈرڈ" کو دریافت کرنے میں کامیاب رہا۔ تاہم، یہ بہت ممکن ہے کہ FDG اور PTAU صرف AD کی تشخیص پر ABETA کے اثر کے کچھ حصے کی وضاحت کریں۔ DX پر ABETA سے براہ راست وجہ موجود ہو سکتی ہے۔ اگرچہ ہم طول البلد ڈیٹا کی تجویز کرتے ہیں، لیکن طول بلد ڈیٹا اکٹھا کرنا اکثر مہنگا ہوتا ہے جس کے نتیجے میں نمونے کا سائز چھوٹا ہوتا ہے۔ ایک چھوٹا نمونہ سائز کازل ڈسکوری الگورتھم میں شماریاتی طاقت کو کم کرتا ہے جو کہ ایک تجارت ہے۔ ہم نے نمونے کے سائز کو 50 فیصد اور 75 فیصد تک کم کرنے کی کوشش کی اور وہی تجزیہ کیا۔ جب ہم نے نمونے کے سائز کو 50 فیصد تک کم کیا تو 100 بوٹسٹریپ تکرار میں دریافت شدہ کناروں کی کل تعداد کم ہو گئی۔ تاہم، مکمل نمونے پر مستقل طور پر دریافت کیے گئے کناروں کو کم کیے گئے نمونے پر بھی مستقل طور پر دریافت کیا گیا۔ ہم نے اسی طرح کی درستگی اور یاد حاصل کی۔ جب ہم نے نمونے کے سائز کو مزید کم کیا (مجموعی طور پر 75 فیصد)، کناروں کی کل تعداد مزید کم ہوگئی۔ جب کہ کثرت سے دریافت ہونے والے کناروں کی دریافت ہوتی رہی، "شور کے کناروں" کی تعداد میں اضافہ ہوتا گیا، ایسے کناروں جو صرف چند بوٹسٹریپ تکرار میں دریافت ہوئے تھے۔

آخر میں، وقف شدہ causal دریافت الگورتھم نے causal ڈھانچہ دریافت کرنے میں SEM کو پیچھے چھوڑ دیا۔ حقیقی دنیا کے ڈیٹا کے تجزیہ میں، ڈیٹا کے معیار نے دریافت شدہ ڈھانچے کی درستگی کو متاثر کیا۔ پیشگی معلومات کو شامل کرنا اور طولانی ڈیٹا کا استعمال الگورتھم کو کچھ ممکنہ غلطیاں کرنے سے روک کر دریافت شدہ نتیجہ کو بہتر بنا سکتا ہے۔

Cistanche can prevent Alzheimer's disease, choose Cistanche for brain health, click here to get samples

Cistanche الزائمر کی بیماری کو روک سکتا ہے، دماغی صحت کے لیے Cistanche کا انتخاب کریں، نمونے حاصل کرنے کے لیے یہاں کلک کریں۔




حوالہ جات

1. بیم، اے ایل اور کوہانے، ہیلتھ کیئر میں بگ ڈیٹا اور مشین لرننگ ہیلتھ کیئر بگ ڈیٹا اور ہیلتھ کیئر میں مشین لرننگ بگ ڈیٹا اور ہیلتھ کیئر میں مشین لرننگ۔ JAMA 319, 1317–1318, https://doi.org/10.1001/jama.2017.18391 (2018)۔

2. Murdoch, TB & Detsky, AS Te Inevitable Application of Big Data to Health CareTe صحت ​​کی دیکھ بھال کے لیے بڑے ڈیٹا کی ناگزیر درخواست۔ جامعہ 309، 1351-1352۔

3. Trister, AD, Buist, DSM & Lee, CI کیا مشین لرننگ بریسٹ کینسر اسکریننگ میں بیلنس بتائے گی؟کیا مشین لرننگ بریسٹ کینسر اسکریننگ میں بیلنس بتائے گی؟کیا مشین لرننگ بریسٹ کینسر اسکریننگ میں بیلنس بتائے گی؟ JAMA آنکولوجی 3، 1463–1464۔

4. راجرز، MB Tere's No Tomorrow for TOMORROW۔ الزفورم

5. Arvanitakis، Z. et al. ذیابیطس کا تعلق دماغی انفکشن سے ہے لیکن بوڑھے لوگوں میں AD پیتھالوجی سے نہیں۔ نیورولوجی 67، 1960-1965۔

6. Vemuri، P. et al. بزرگ نمونے میں عمر، عروقی صحت، اور الزائمر کی بیماری کے بائیو مارکر۔ این۔ نیورول. 82، 706–718۔

7. جیک، سی آر جونیئر وغیرہ۔ الزائمر کی بیماری میں پیتھوفزیولوجیکل عمل کا سراغ لگانا: متحرک بائیو مارکر کا ایک تازہ ترین فرضی ماڈل۔ لینسیٹ نیورول۔ 12، 207–216، https://doi.org/10.1016/s1474-4422(12)70291-0 (2013)۔

8. پرل، جے کازالٹی: ماڈلز، ریزننگ اور انفرنس۔ والیوم 64 (کیمبرج یونیورسٹی پریس، 2000)۔

9. Spirtes, P., Meek, C. & Richardson, TS Causal Inference in the Presence of Latent Variables and Selection Bias. CoRR abs/1302.4983(2013)۔

10. ریمسی، جے ڈی مسلسل متغیرات کے لیے لالچی مساوات کی تلاش کو بڑھا رہا ہے۔ CoRR abs/1507.07749 (2015)۔

11. چیکرنگ، لالچی تلاش کے ساتھ ڈی ایم بہترین ساخت کی شناخت۔ جرنل آف مشین لرننگ ریسرچ 3، 507–554 (2002)۔

12. مانی، ایس، اسپرٹس، پی اینڈ کوپر، جی ایف کازل دریافت کے لیے Y ڈھانچے کا ایک نظریاتی مطالعہ۔ CoRR abs/1206.6853 (2012)۔

13. Spirtes, P., Clark, G. & Scheines, R. Causation, Prediction, and Search. (ٹی ایم آئی ٹی پریس، 2000)۔

14. Schwarz, G. ایک ماڈل کے طول و عرض کا اندازہ لگانا۔ اعداد و شمار کے اعدادوشمار 6، 461–464۔

15. Meek، C. گرافیکل ماڈلز: کازل اور شماریاتی ماڈلز کا انتخاب، (1997)۔

16. کلائن، آر بی اصول اور ساختی مساوات ماڈلنگ کی مشق، تیسرا ایڈیشن۔ 265–295 (گیلفورڈ پریس، 2011)۔

17. Heckerman, D., Meek, C. & Cooper, G. Innovations in Machine Learning: Theory and Applications (eds. Dawn E. Holmes & Lakhmi C. Jain) 1–28 (Springer Berlin Heidelberg, 2006).

18. Rosseel، Y. lavaan: ساختی مساوات کی ماڈلنگ کے لیے ایک R پیکیج۔ جرنل آف شماریاتی سافٹ ویئر 48، 36، https://doi.org/10.18637/ jss.v048.i02 (2012)۔

19. وینر، میگاواٹ وغیرہ۔ الزائمر کی بیماری نیورو امیجنگ انیشیٹو کا اثر، 2004 سے 2014۔ الزائمر اور ڈیمنشیا: الزائمر ایسوسی ایشن کا جریدہ 11، 865–884۔

20. مشرا، ایس وغیرہ۔ پری کلینیکل الزائمر بیماری میں طول بلد دماغی امیجنگ: APOE epsilon4 genotype کا اثر۔ دماغ 141، 1828-1839۔


شاید آپ یہ بھی پسند کریں