0

אלגוריתם חדש - גוגל קפאין

0 תגובות   יום שישי , 18/6/10, 04:19

 גוגל קפאין ההשקה הרשמית בשבוע שעבר העלתה את רמת הכוננות שלי והערנות שלי לגבי כל נושא מהירות אינדוקס העמודים ברשת.  גוגל קפאין הושק בכדי לשפר את מהירות האינדוקס, הרלוונטיות וכמות וגמישות המידע שנאסף בכל סריקה של גוגל.  גוגל מזמן שמו לעצמם חזית מלחמה חדשה ומעבר למלחמות הבלתי פוסקות נגד ספאמרים ומקדמים בשיטות פסולות, גוגל שמו לעצמם מטרה לשפר את האינטרנט ולייעל אותו. 

 

אינטרנט מהיר יותר - תוצאות רלוונטיות יותר 

 

חזית המהירות תמיד הייתה שם, כבר ב-2005 גוגל עמלו על שיפור מהירות אינדוקס התוצאות וניסו לגשר על הפערים שנוצרים בין מרכזי המידע שלהם בעולם. רק לאחר פיתוחים של שנים ושנה שלמה של ניסויים במרכז מידע ספציפי על קפאין ואנו יכולים להתחיל לראות שינוי מהותי באופן של בו גוגל מאנדקסים את המידע וכמה רלוונטי הוא.

 

שיטת העבודה השינה של גוגל הייתה כזו, גוגל היו סורקים כמות אדירה של מידע מהרשת, ואוספים מידע מכל עמוד שנסרק (כמות מידע מוגבלת יחסית). לאחר הסריקה ואיסוף המידע במרכז מידע אחד, גוגל היו מאנדקסים את המידע שנסרק ועוברים לבצע את אותה פעולה שוב על חתיכה אחת מהרשת.

 

שיטת עבודה זו מכילה מספר בעיות בתוכה. מכיוון שגוגל סורקים חלקים גדולים מהאינטרנט בכל פעם ורק אז מאנדקסים את המידע. נוצרו פערים בין הצגת התוצאות במרכזי המידע השונים וגולשים שתחברו לשני מרכזי מידע שונים יראו תוצאות שונות, ואף אותו גולש שיחפש פעמיים את השאילתא ויגיע למרכז מידע שונה יכול לראות תזוזה במיקומים.

 

תופעה זו מכונה ריקוד גוגל  מכיוון שהתוצאות רוקדות מכאן לשם, אותם ריקודים מורטי עצבים היו מדירים מספיק שינה מעיני חברות קידום אתרים ומעיניהם של בעלי העסקים. קפאין מהווה שיפור משמעותי אמיתי בכל נושא גישור על אותם פערים. מכיוון שבשיטת העבודה החדשה קל לגוגל לאנדקס בצורה מהירה יותר.

 

שיטת העבודה לאחר הטמעתו של קפאין היא כזו, במקום לסרוק כמויות אדירות של מידע ורק אז לאנדקס אותם, קפאין מאפשר לגוגל לסרוק כל עמוד בנפרד לשמור עליו מידע רב יותר להשתמש במידע זה בצורה גמישה יותר ביחס לכל הביטויים והפרמטרים השונים לדירוג. ומייד לאנדקס את אותו עמוד ולהטימע את האינדוקס בכל מרכזי המידע בצורה מהירה יותר.

 

ברגע שגוגל סורקים את העמודים בנפרד ומאנדקסים אותם מייד, נעשה גישור על הפערים בין מרכזי המידע. והאינדוקס נעשה באופן פרטני, מה שמאפשר לגוגל לאגור יותר מידע על כל עמוד ומשפר את המיקוד של גוגל על הרלוונטיות של אותו עמוד ביחס לביטויים המופיעים בו. 

 

גוגל שמו לעצמם חזון חזק וקונקרטי לשפר את האינטרנט בכל הנוגע לביצועים, לכן זמן טעינת האתר הפך לפרמטר והוטמע האלגוריתם של MAYDAY, אלגוריתם זה הולך יד ביד עם קפאין אם כי הם אלגוריתמים נפרדים ואינם תלויים זה בזה. אך שיפור האינדוקס בביטויים של זנב ארוך עוזר ומסייע לסרוק במהירות ויעילות יותר.

 

לסיכום:

גוגל קפאין מהווה פריצת דרך ממשית בכל הצורה שבה גוגל מאנדקסים את המידע שנסרק, ובאופן הסריקה עצמו. יותר פרמטריםן נשמרים בצד בכל סריקה ויותר מידע רלוונטי נשמר על כל עמוד, מה שיהפוך את הסריקות הבאות לקלות יותר, מהירות יותר ורלוונטיות יותר.

 

דרג את התוכן: