(קוףשמן מוצא חיזוק ממקור לא צפוי ומתחיל לתפוס תחת)
אני כנראה באיזה אגו טריפ רציני. אחרי שכתבתי על עצמי בפוסט הקודם, הטפתי מוסר, יצאתי כנגד התנועה הפמיניסטית כולה בפוסט של דנית ומן הסתם הצלחתי לעצבן כמה אנשים... עכשיו אני רוצה לכתוב פוסט שלם שהכותרת שלו יכולה להיות "אמרתי לכם!"
טוב, בערך.
לפני שבועיים כתבתי על השינוי בדף הבית של גוגל וניחשתי שהגדלת תיבת החיפוש בדף פונה בין היתר למחפשים מתקדמים ושהיא אמורה לאפשר הכנסת יותר מילים בתיבה ובכך לשפר את תוצאות החיפוש.
כמה מהמגיבים טענו שמחפשים מתקדמים הם מיעוט, ושסביר יותר להניח שלהגדלת התיבה היו סיבות אחרות. מאחר ומדובר במגיבים חכמים ומביני עניין (כל המגיבים אצלי הם חכמים ומביני עניין), נאלצתי לסגת בי, לפחות באופן חלקי.
אלי הציע את האפשרות שלהגדלת תיבת החיפוש לא הייתה מטרה מעבר לזאת עליה גוגל הצהירו- הגדלת תיבת החיפוש.
דנית הציעה שזה נעשה מתוך התחשבות באוכלוסיה המבוגרת, שעושה שימוש הולך וגובר באינטרנט בכלל ובגוגל בפרט.
את ההשערה המוצלחת ביותר בעיני סיפק ברק דנין. לדעתו תיבת חיפוש גדולה יותר מתאימה למסכים בעלי רזולוציות גבוהות, ההופכים נפוצים יותר ויותר. להשערה הזו הוא צירף גם תמונות מסך שמראות את תיבת החיפוש לפני ואחרי השינוי, ובהן רואים שהתיבה גדלה גם בגובה ולא רק באורך. מה שזה אומר לכאורה זה שמספר התווים שניתן להכניס בתיבה לא השתנה, רק הגודל שלהם.
נאלצתי להסכים.
אבל היום קראתי את הפוסט הזה, אצל גדי להב ופתאום ראיתי נתונים שדווקא תומכים בתיאוריה הראשונה שלי- שהגדלת התיבה נועדה לאפשר הכנסת יותר תווים.
הנתונים שלהב מציג מראים במפורש שמספר החיפושים מרובי המילים הולך ועולה באופן מתמיד. להב מפרש שזה נובע מהריבוי האקספוננציאלי של המידע. אחד המגיבים טוען שפשוט אחוז גבוהה יותר של המשתמשים מבין שכדי לקבל תוצאות איכותיות צריך להכניס יותר מילים. לדעתי מדובר בשילוב של שני הגורמים.
בכל אופן, העובדה שיש גידול מתמיד במספר החיפושים עם כמה מילים גרמה לי לחשוד מחדש שהגדלת התיבה לא נעשתה רק מטעמים מיתוגיים ("להדגיש שאנחנו מרוכזים בחיפוש") או לצורך התאמה למסכים בעלי רזולוציה גבוהה. הנתונים שמציג להב מראים שהעלייה המשמעותית ביותר היא בחיפושים בני שמונה מילים. אם זו המגמה, אך טבעי שגוגל ירצו להגדיל את התיבה, כדי לאפשר מונחי חיפוש ארוכים אף יותר.
אבל התמונות של ברק מראות במפורש שהתיבה גדלה גם לגובה. אז מה קורה כאן בעצם? החלטתי לעשות סוף סוף את שיעורי הבית שהייתי צריך לעשות מלכתחילה- לבדוק בעצמי.
לצורך כך השתמשתי ב"מכונת הזמן האינטרנטית" שנקראת Way Back Machine. באמצעות האתר הזה תוכלו להגיע לגרסאות ישנות יותר של אתרי אינטרנט (לא של כולם, אבל של המון).
פתחתי את גוגל החדש, ולצידו את גוגל הישן, והקלדתי.
בגרסה הישנה יכולתי לכתוב כך:
מעניין כמה מילים נכנסות לתיבה הזאת. כדאי שאני אבדוק סוף ס
ובגרסה החדשה נכנס לי המשפט הזה:
מעניין כמה מילים נכנסות לתיבה הזאת. כדאי שאני אבדוק סוף סוף. אולי פשו
הנה צילומי המסך.
בגרסה החדשה של דף הבית של גוגל, ניתן להכניס 12 תווים יותר מאשר בקודמת. בערך שתי מילים נוספות.
כפי שציינתי גם בפוסט הקודם, ההבדל הזה הוא וירטואלי בלבד. בפועל, בשתי התיבות ניתן להמשיך לכתוב עוד ועוד (לא בדקתי עד מתי). העניין הוא שכאשר מכניסים יותר מילים מאורך התיבה, המילים הראשונות שכתבנו "נדחקות לאחור" ואנחנו לא רואים אותן יותר. זה מחסום פסיכולוגי שימנע ממשתמשים רבים לכתוב יותר ממה שניתן לראות.
אז נראה שהשינוי בכל זאת נועד לאפשר חיפושים מדויקים יותר, אבל כנראה שלא רק. הגדלת התיבה גם לגובה אכן מאפשרת פונט גדול יותר וגם נראית טוב יותר ברזולוציות גבוהות. שינוי קטן לגוגל, שינוי גדול למשתמשים...
לסיום קצת על חיפוש, גדי להב מתייחס לצורך בטכנולוגיית חיפוש חדשה, כזו שלא תצריך אותנו להאריך עוד ועוד את ביטויי החיפוש שלנו כדי לקבל תוצאה סבירה. אני (כמו רבים אחרים) מסכים אתו שחוויית השימוש בגוגל היא פגומה, והמצב במנועים האחרים לא טוב יותר. כולנו התרגלנו להקיש מספר מילים ואז לעבור על עשרות או מאות תוצאות ולנסות להבין מהטקסט האם הלחיצה על הקישור תוביל אותנו לאתר שעונה על הצורך שלנו. זו מלאכה מעייפת, שדורשת מידת תשומת לב שלא אופיינית לשימוש הרגיל באינטרנט.
מנועי החיפוש מוצאים בדרך כלל אלפי דפי אינטרנט שעונים על החיפוש שלנו, אבל בפועל יש לנו סבלנות לעבור רק על העמוד הראשון של התוצאות, מה שהוביל ליצירת אקוסיסטמה ענקית של מקדמי אתרים, כי אם אתה לא בעמוד הראשון בגוגל, אתה לא קיים.
העניין הוא שהטכנולוגיה שתעשה מהפכה בחיפוש כנראה עדיין רחוקה. השפה האנושית מורכבת למדי, והשימוש שאנחנו עושים בה הוא כל כך גמיש ובלתי צפוי שקשה לדמיין כיצד יוצרים אלגוריתמים שיפענחו למה התכוונו כשכתבנו כך או אחרת.
רבים ניגשים לבעיה הזו בצד של האינטרנט. מנועי החיפוש של היום מחפשים את הטקסט שהקלדנו בתוך הררי הטקסט של האינטרנט. לאחר מכן הם מפעילים אלגוריתמים מסובכים כדי לתעדף את כל התוצאות, כלומר, להחליט איזה מבין כל הדפים שמכילים את המילים שהקלדנו חשוב יותר. למנועים האלה אין ממש יכולת להבין קונטקסט. כלומר, המנוע אומנם מוצא את המילים בתוך הדף אבל אין לו מושג ירוק על מה מדבר הדף באופן כללי.
כאשר מדברים על "רשת סמנטית" מדברים בין היתר על מנועים שיוכלו להבין את הקונטקסט, את הנושא שבו הדף עוסק, וגם על סטנדרטים שיגרמו לדף "לספר" למנוע במה הוא עוסק.
חשבתי על האפשרות לנסות לתקוף את אותה בעיה דווקא בצד של המשתמש. אחרי הכל, המנוע לא מבין את הקונטקסט של המשתמש בדיוק כפי שהוא לא מבין את הקונטקסט של הדף.
אחת הדוגמאות הנפוצות היא Paris Hilton. האם כשהמחפש הקליד את המילים האלה הוא התכוון למלון מפואר בעיר האורות או לסלבריטי בעלת תדמית מביכה?
אחת הדרכים לנסות להבין זאת היא באמצעות החיפושים הקודמים שלו. צורת החיפוש המקובלת היום היא כזו: מקלידים את מונח החיפוש, עוברים על התוצאות בדף הראשון ומקסימום גם בשני, אם לא מוצאים את מה שמחפשים כותבים מונח חדש וחוזרים על כל התהליך שוב...
עד כמה שאני מבין, כל כתיבת מונח חיפוש פותחת מבחינת המנוע תהליך חדש, שמתחיל מאפס. אין שום "הסקת מסקנות" בין שלב לשלב.
זו צורת פעולה מאוד לא אנושית.
נגיד, לצורך המשל, שאתם מגיעים לספרייה ומתארים בפני הספרנית ספר כלשהו שאתם מחפשים אבל לא זוכרים את מלוא הפרטים עליו.
הספרנית הולכת וחוזרת כעבות מספר דקות עם שלושה ספרים שנדמה לה שעונים על הפרטים שכן הצלחתם לזכור. אבל אף אחד מהם הוא לא מה שחיפשתם.
אתם אומרים משהו כמו "לא, לספר ההוא הייתה כריכה חומה".
מה לדעתכם תעשה הספרנית עכשיו? אם היא הייתה גוגל, היא הייתה הולכת, וחוזרת כעבור מספר שניות עם כל הספרים בעלי הכריכה החומה שיש בספרייה... לא ספרנית יעילה במיוחד, נכון?
מה שסביר יותר שהיא תעשה יהיה לצרף את המידע שהיא קיבלה בחיפוש הראשון, עם המידע שהיא קיבלה עכשיו, ובכך לצמצם את מספר האפשרויות.
מנועים מסוימים, כמו למשל בינג של מייקרוסופט, ניסו להיעזר בגישה הזו באמצעות הוספת "פילטרים" בדף התוצאות, שמאפשרים למקד יותר את החיפוש, אבל שוב, עד כמה שאני מבין, אף אחד מהם לא עושה שימוש בתהליך כדי להסיק מסקנות. כלומר, אף מנוע לא מנסה להבין למה המחפש מתכוון, על ידי שימוש במידע המצטבר שהוא מעביר באמצעות מספר פעולות.
נניח שהמשתמש שלנו הקיש מספר מילים, נכנס לדף התוצאות, לחץ על קישור או שניים ואז חזר והקיש מספר מילים אחרות. הצלבה של המונח הראשון עם השני, ובנוסף בחינת הקישורים עליהם הוא בחר ללחוץ, עשויות להניב מידע קונטקסטואלי שניתן אולי לניתוח והבנה גם בכלים הטכנולוגיים הקיימים כיום.
הרעיון הזה מתבסס על גישה בשימושיות שאני אוהב לכנות "גישת הדשא". היא מתבססת על העיקרון של סלילת השבילים במקום בו כולם הולכים במילא (במקום לנסות לשכנע אנשים ללכת על השביל שסללנו). האגדה מספרת על קמפוס אוניברסיטאי שבו מספר גדול של בניינים. האדריכל שתכנן את הקמפוס (או את השיפוץ שלו) החליט פשוט לשתול דשא בין כל הבניינים, ואז לראות איפה נוצרים חריצים בדשא (המקומות עליהם דרכו הכי הרבה), ושם לסלול שבילים.
לפי העיקרון הזה, אנחנו מנסים לנצל את אותן פעולות שהמשתמש במילא התרגל לעשות, כדי לשפר את החוויה שלו. במקרה הנ"ל אנחנו ננסה לנצל את רצף הפעולות שעושה מחפש ממוצע כדי לדלות מידע נוסף ולשפר את התוצאות. זה נכון שבעולם אידיאלי המשתמש היה נזקק לפעולה אחת בלבד כדי להגיע בדיוק למה שהוא חיפש, אבל כאמור, אני חושב שטכנולוגית זה עוד רחוק, וזה עוד לפני שהזכרנו את העובדה שחלק גדול מהמחפשים בכלל לא יודעים בדיוק מה הם מחפשים.
דרג את התוכן:
הבעיה היא בTRADEOFF בין ההבטחה לשיפור באכות חיפוש לבין הויתור הגדול (מאד) מבחינת פרטיות. וזה גם ככה טריטוריה בעייתית בשביל גוגל. לבנות פרופיל משתמש, שיתבסס על היסטוריית גלישה וכמובן יצדיק את עצמו ע"י פרסום ממוקד, נראה כרגע כמו מיליון דולר באמצע שדה מוקשים: כולם בטוחים שזה שווה את זה, אבל הבעיתיות הציבורית, משפטית ואתית יפוצצו אותך בדרך (ע"ע behavioral targeting וגם Phrom).
אני לא חושב שזו(איסוף מידע) הדרך היחידה או הטובה ביותר (ברור שהיא עושה רושם של היותר קלה). אם נקח את הדוגמא של "פריס הילטון", אזי הבעיה היא ששתי השאילתות הבאות:
1. איך אני מזמין חדר במלון הילטון בפריז? (או משהו דומה)
2. איך נראית פריס הילטון הזו שכולם מדברים עליה (אבל איך היא נראית באמת, au naturel;לצרכים מחקרים בלבד)
מתמפות, אחרי שנים של ניוון, לאותו חיפוש: paris hilton. וזה לא בהכרח חייב להיות ככה. מקרה קלאסי שאופן הפתרון לבעיה (חיפוש של תדירות הופעת מילים, וכו') מכתיבה את אופן השימוש ולא ההיפך.