Bakenam
03-23-2009, 09:04 PM
بسم الله الرحمن الرحيم
السلام عليكم
التنقيب عن المعلومات حول كيفية عمل خوارزمية PageRank في Google ومدى تأثيرها على النتائج ،،
ماهية PageRank :
يستخدم محرك البحث Google الخوارزمية PageRank التي تحمل برائة اختراع خاصة بالسيدين Sergey Brin و Larry Page . وظهرت هذهـ الخوارزمية في المقالة :
To Anatomy Of a Large-Scale Hyper****ual *** Search Engine
[ هيكلة محركات بحث الويب النصية التشعبية من المقياس الكبير ]
تعتمد هذهـ الخوارزمية على فرضية بسيطة : نقيس أهمية المقالة العلمية بعدد المراجع إلى هذهـ المقالة . ونقل السيدان Brin و Page هذهـ الفرضية إلى عالم الويب : إمكانية قياس أهمية صفحة الويب من خلال إحصاء عدد الارتباطات التشعبية التي تؤشر إليها .
ماهية الخوارزمية :
تتمحور خورزمية PageRank حول المعادلة الرياضية التالية :
http://www.ar4up.com/uploads/images/ar4up-be44a5180c.jpg
حيث
PR(A) قيمة PageRank من أجل الصفحة A
PR(T1) قيمة PageRank من أجل الصفحة T1
C(T1) عدد الارتباطات الخارجة من الصفحة T1
d عامل ثقيل موجود في المجال ]1..0[ ( أي أن 0<d<1 ) , ويأخذ d عادة القيمة 0.85
n عدد الارتباطات الواردة إلى الصفحة A
إذا نحسب PageRank لصفحة الويب من خلال إيجاد مجموع قيم PageRank لجميع الصفحات المرتبطة بها ( أي الصفحات التي تحوي إرتباطا إلى هذهـ الصفحة A ) مقسوماً على عدد الارتباطات الخارجة من هذهـ الصفحات ..
مغزى هذهـ المعادلة ؟
لننظر إلى هذهـ المعادلة من وجهة نظر محرك البحث : هناك طريقتان لتأثير PageRank في ترتيب الصفحات في Google :
عدد الارتباطات القادمة ، ويتحسن ترتيب الصفحة لدى ازدياد هذا العدد : يضيف كل ارتباط حداً موجباً في المعادلة السابقة . إذاً ، لايمكن أن يحمل الارتباط الجديد أي تأثير سلبي .
العدد الكلي للارتباطات الصادرة من الصفحات التي تؤشر إلى الصفحة A : من الأفضل أن يكون هذا العدد اقل مايمكن .
لنفترض وجود صفحتين تملكان نفس ترتيب PageRank وتؤشران إلى الصفحة A وتمتلك إحدى الصفحتين خمسة ارتباطات صادرة ، بينما تتضمن الصفحة الثانية عشرة ارتباطات صادرة . سنلاحظ ان للصفحة الأولى ضعف التأثير الأيجابي الذي تقدمه الصفحة الثانية في ترتيب PageRank للصفحة A .
فائدة حساب PageRank
هناك مقاومة جيدة في PageRank لمحاولات تجميع الارتباطات ، فقيمة PageRank تبقى ثابته خلال العمليات الحسابية ، لنفرض أن لصفحة الويب قيمة PageRank مساوية لـ 4 ، وتتضمن هذهـ الصفحة ارتباطين خارجين إلى صفحتين في هذهـ الحالة ستحصل كل صفحة على وحدتين من PageRank .
لنفرض أن قيمة PageRank تساوي الواحد من أجل كل صفحة ويب في بداية وجودها في فهرس Google . وهكذا يزداد مجموع PageRank للموقع عند ازدياد عدد صفحات الويب فيه ، فإن احتوى الموقع على عشر صفحات ويب فسيحصل في البداية على عشرة وحدات في PageRank ، ثم تتقاسم صفحات الموقع هذه الوحدات من خلال الارتباطات التشعيبية . كما يبدأ الموقع بالقيمة PageRank12 عند احتوائه 12 صفحة .
مجملاً ، نسنتنج امكانية تحسين قيمة PageRank للموقع ككل من خلال انشاء محتويات جديدة [ أي المزيد من الصفحات ] ، ثم نتحكم بتوزيع قيمة PageRank الكلية للموقع بواسطة ترابطات داخلية مدروسة بين مختلف الموقع .
أتمنى أن يحوز الدرس على رضاكم
السلام عليكم
التنقيب عن المعلومات حول كيفية عمل خوارزمية PageRank في Google ومدى تأثيرها على النتائج ،،
ماهية PageRank :
يستخدم محرك البحث Google الخوارزمية PageRank التي تحمل برائة اختراع خاصة بالسيدين Sergey Brin و Larry Page . وظهرت هذهـ الخوارزمية في المقالة :
To Anatomy Of a Large-Scale Hyper****ual *** Search Engine
[ هيكلة محركات بحث الويب النصية التشعبية من المقياس الكبير ]
تعتمد هذهـ الخوارزمية على فرضية بسيطة : نقيس أهمية المقالة العلمية بعدد المراجع إلى هذهـ المقالة . ونقل السيدان Brin و Page هذهـ الفرضية إلى عالم الويب : إمكانية قياس أهمية صفحة الويب من خلال إحصاء عدد الارتباطات التشعبية التي تؤشر إليها .
ماهية الخوارزمية :
تتمحور خورزمية PageRank حول المعادلة الرياضية التالية :
http://www.ar4up.com/uploads/images/ar4up-be44a5180c.jpg
حيث
PR(A) قيمة PageRank من أجل الصفحة A
PR(T1) قيمة PageRank من أجل الصفحة T1
C(T1) عدد الارتباطات الخارجة من الصفحة T1
d عامل ثقيل موجود في المجال ]1..0[ ( أي أن 0<d<1 ) , ويأخذ d عادة القيمة 0.85
n عدد الارتباطات الواردة إلى الصفحة A
إذا نحسب PageRank لصفحة الويب من خلال إيجاد مجموع قيم PageRank لجميع الصفحات المرتبطة بها ( أي الصفحات التي تحوي إرتباطا إلى هذهـ الصفحة A ) مقسوماً على عدد الارتباطات الخارجة من هذهـ الصفحات ..
مغزى هذهـ المعادلة ؟
لننظر إلى هذهـ المعادلة من وجهة نظر محرك البحث : هناك طريقتان لتأثير PageRank في ترتيب الصفحات في Google :
عدد الارتباطات القادمة ، ويتحسن ترتيب الصفحة لدى ازدياد هذا العدد : يضيف كل ارتباط حداً موجباً في المعادلة السابقة . إذاً ، لايمكن أن يحمل الارتباط الجديد أي تأثير سلبي .
العدد الكلي للارتباطات الصادرة من الصفحات التي تؤشر إلى الصفحة A : من الأفضل أن يكون هذا العدد اقل مايمكن .
لنفترض وجود صفحتين تملكان نفس ترتيب PageRank وتؤشران إلى الصفحة A وتمتلك إحدى الصفحتين خمسة ارتباطات صادرة ، بينما تتضمن الصفحة الثانية عشرة ارتباطات صادرة . سنلاحظ ان للصفحة الأولى ضعف التأثير الأيجابي الذي تقدمه الصفحة الثانية في ترتيب PageRank للصفحة A .
فائدة حساب PageRank
هناك مقاومة جيدة في PageRank لمحاولات تجميع الارتباطات ، فقيمة PageRank تبقى ثابته خلال العمليات الحسابية ، لنفرض أن لصفحة الويب قيمة PageRank مساوية لـ 4 ، وتتضمن هذهـ الصفحة ارتباطين خارجين إلى صفحتين في هذهـ الحالة ستحصل كل صفحة على وحدتين من PageRank .
لنفرض أن قيمة PageRank تساوي الواحد من أجل كل صفحة ويب في بداية وجودها في فهرس Google . وهكذا يزداد مجموع PageRank للموقع عند ازدياد عدد صفحات الويب فيه ، فإن احتوى الموقع على عشر صفحات ويب فسيحصل في البداية على عشرة وحدات في PageRank ، ثم تتقاسم صفحات الموقع هذه الوحدات من خلال الارتباطات التشعيبية . كما يبدأ الموقع بالقيمة PageRank12 عند احتوائه 12 صفحة .
مجملاً ، نسنتنج امكانية تحسين قيمة PageRank للموقع ككل من خلال انشاء محتويات جديدة [ أي المزيد من الصفحات ] ، ثم نتحكم بتوزيع قيمة PageRank الكلية للموقع بواسطة ترابطات داخلية مدروسة بين مختلف الموقع .
أتمنى أن يحوز الدرس على رضاكم