ארכיון תגיות: מנוע חיפוש

האדם הוא תבנית מנוע החיפוש שלו

מנועי חיפוש רוצים להחזיר לגולשים את התוצאות ×”×›×™ רלוונטיות לשאילתת החיפוש שלהם. כדי לעשות זאת הם משתמשים באלגוריתמים שמשקללים גורמים שונים באתר כדי להגיע לתוצאה שהיא הרלוונטיות של האתר לשאילתת החיפוש. חברות מסחריות (לא רק, אבל בעיקר) רוצות שהאתר שלהן ×™×”×™×” בעמוד הראשון של תוצאות החיפוש, ×›×™ רוב הגולשים לא טורחים להגיע מעבר לזה. כדי לעשות זאת, הן משתמשות בשיטות שונות שגורמות לאתר שלהן להיות חבר טוב מאד של האלגוריתם של מנועי החיפוש. כיוון שמנועי החיפוש הם המלכים כרגע, הם אלו שמחליטים אלו שיטות לגיטימיות לקידום האתר למקומות הראשונים (מכונות White hate SEO) ואילו אינן לגיטימיות (מכונות black hat SEO). השיטות השחורות כוללות, למשל, כתיבת טקסט בצבע לבן על רקע לבן או הפניית הגולשים מעמוד שנועד למנוע החיפוש לעמוד שהוא ידידותי לגולשים. לדוגמה, אם אנחנו משתמשים בשיטות כאלו, אז סביר להניח שנרצה שכל מילות החיפוש הספרותיות יפנו את הגולש אלינו, וכך בהמשך העמוד, כתובות בלבן מילים כמו אליטירציה, פרוזודיה ונבוקוב המוקדם. אלא, שכאמור, מנועי החיפוש הם המלכים. ולכן, מי שמשתמש בשיטות כאלו נענש – הוא מורחק מתוצאות החיפוש לזמן בלתי ידוע. כמו שאיתמר ציין בחוכמה רבה, השיטות האלו מתייחסות למנוע החיפוש כמו אל ילד מפגר – הן מנסות להסביר לאט ובבהירות ×›×™ האתר ×”×–×” הוא ×”×›×™ רלוונטי. אנשים רגילים הם פחות מפגרים ויכולת ניתוח הטקסט שלהם מורכבת בהרבה. ולכן, הם כמו מנועי חיפוש, רק טובים יותר ואיטיים יותר. העובדה שהם איטיים יותר וחסרי חשיבות אינה אומרת שהם אינם יכולים להכריז על שיטות מסויימות כעל בלתי לגיטימיות. ובכן, אני רוצה להיות לרגע מנוע חיפוש מוביל ולבנות רשימה של מילים, צירופי מילים וביטויים אשר כל מי שישתמש בהם ביצירות הספרותיות שלו, יגרום לרובוט הקורא שלי לזחול החוצה מן הספר. מדובר בצירופי מילים בנאליים להחריד, אשר תופסים מקום על הדף, אולם איבדו מזמן משמעות כלשהי. ניקח לדוגמה את צירוף המילים "לחי רכה". ראשית, מעטות הלחיים שאינן רכות. שנית, הביטוי לחי רכה אמור להיות סינקדוכי לגוף הרך והמזמין של אותה בחורה או אפילו לאישיותה כולה. אבל הוא כל כך משומש שהוא מעיד רק על חוסר היכולת של הסופר ליצור משהו חדש בעולם ×”×–×”. ועל אנשים כאלו, אין לי זמן לבזבז. הרשימה הזו כוללת בתוכה כמה רמות של חטאים: אין השימוש במטאפורה שחוקה לתיאור חדר דומה לאיפיון דמות עילג ובנאלי. ובכל זאת, שניהם חטאים. כמו כן, למותר לציין ×›×™ בניגוד למנועי החיפוש כיום, היכולת הסמנטית שלי היא ממש מופלאה. עבורם הביטוי "לחי רכה" שונה מהביטוי "לחיה הרכה". אני, לעומת זאת, יודעת ×›×™ מדובר בדיוק באותו דבר. ולכן, סופרים, הישמרו לנפשיכם. הרשימה שתבוא עוד מעט היא כמובן רשימה ראשונית ואתם כולכם (כן, כן, כולכם) מוזמנים להוסיף לה. והרי הרשימה: 1. לחי רכה 2. אולם רחב ידיים 3. כתמי שפתון שעיטרו את הכוס\בדל סיגריה 4. ידיים מסוקסות (אלמותי!) 5. ריסים ארוכים 6. חום כמו שוקולד ("אדום כמו עגבנייה" או "צהוב כלימון" ×–×” אותו דבר) 7. תלתלים רכים (לא באמת, מתי פגשתם תלתלים רכים לבד מאלו שיצאו כרגע מן החפיפה?) 8. חושניות ×¢×–×” 9. מוזיקה מחרישת אוזניים 10. עוגן של יציבות 11. לכרסם עוגייה (מתי מישהו בספרות המזדיינת הזאת פשוט יאכל עוגייה? ×–×” קורה לי בחיים כל הזמן) 12. גוש חסם/הצטבר/ נקווה בגרונה 13. הקמט בין עיניו העמיק 14. גוץ שמנמן 15. עשתה דרכה 16. שפתיים מלאות 17. ידי זהב 18. הזקנה קפצה עליה 19. התגנבה מחשבה לראשה 20. לחזור אליו כמו בומרנג

הדים

ב-13/08/06, סטוארט פאדלי החליט לעדכן את הבלוג שלו. סטוארט עובד במיקרוסופט כמהנדס וראש צוות פיתוח. הוא עדכן את העולם דרך הבלוג שלו שהוא נבחר ע"י ריי אוזי, מחליפו של ביל גייטס, להצטרף לצוות עבודה מיוחד לבניית שירות אינטרנט חדש שעוד לא הוכרז. הוא סיפר על שם הקוד של המוצר החדש ותוכניות לעתיד. תוך זמן קצר, מישהו בעמדה בכירה החליט להוריד את הפרסום, אבל זה כבר היה מאוחר מדי. מנוע החיפוש באתר שמר תקציר די מלא של ההודעה. למרות שההודעה הקודמת של פאדלי נכתבה שנה קודם לכן, היו מספיק אנשים רשומים ל-RSS שלו. אתרים המרכזים RSSים שמרו העתק של ההודעה בזכרון האתר. לכשזו תתפנה, כבר מספיק מתעניינים שמרו תמונת מסך של ההודעה כולה.

*** גוגל × ×”×™×” חלק מהתשתית של החיים שלנו עד שאנחנו בכלל לא חושבים עליו כאתר – הוא רק ספר הכתובות שדרכו אנחנו ממשיכים את שיטוטינו באינטרנט. אנחנו לא חושבים על כך שבשביל שגוגל ידע למצוא לנו אתר, הוא צריך להכיר את התוכן של האתר. אנחנו לא חושבים על כך שבשביל שגוגל יוכל למצוא לנו את האתר כל כך מהר, הוא צריך שאותו תוכן ישב אצלו בצורה זמינה. ליד כל תוצאת חיפוש נמצא קישור ל-Google Cache, העותק המקומי של גוגל. העותק קיים גם אם האתר כבר לא. גם אם מחקנו את הידיעה או העברנו את האתר לכתובת חדשה.

*** ב-20/02/06 העלה אתר החדשות של "× ×¢× ×¢" ידיעה על פיה נפטר ראש הממשלה אריאל שרון. הידיעה – כתבת רטרוספקטיבה שהוכנה למקרה שהוא אכן ימות, אושרה בטעות לתצוגה ×¢"×™ עורך עם אצבע קלילה על העכבר. תוך דקות בודדות הידיעה הורדה מהאתר, אבל ×–×” כבר לא משנה. גולשים ראו, גולשים צילמו והכתבה ×”×’×™×¢×” אפילו עד המתחרים. טעות קטנה שתוקנה מיד, אבל ההדים שלה המשיכו להתפשט.

*** ב-1996 התחיל לפעול ×”-Internet Archive, שמטרתו למנוע ממיליארדי פריטי המידע שמתרוצצים להם באינטרנט לשקוע ולהעלם. הם רוצים להוות ספרייה וירטואלית להיסטוריונים, חוקרים וסתם מתעניינים. בעזרת ×”-Wayback Machine שלהם אנחנו יכולים לראות איך כמעט כל אתר נראה בעבר, לפי תאריכי הדגימות שלהם – ×–×” מדהים, לפעמים, לראות את השינויים ההגדרתיים באתרים בהם אנחנו מבקרים בקביעות. מעניין גם לראות מה לא השתנה.

*** בשנות ה-90, GeoCities היה אחד הספקים הגדולים בעולם של דפי-בית אישיים בחינם. מאות אלפי אנשים בנו עמודי בית מזויעים עם כל הרעות החולות האפשריות. כן, גם אני בניתי לי עמוד בו חלקתי עם העוברים ושבים את טעמי במוזיקה, הספר אותו קראתי באותו זמן ואת כישורי ה-Javascript המתפתחים שלי. הייתי שמח למחוק כל זכר של התועבה מן העולם, אבל אני לא יכול. GeoCities אולי נבלעו ע"י Yahoo לפני שנים, אבל הם לא מוחקים כלום. האתר שלי עדיין קיים, וביותר מכתובת אחת.

*** בלוגרים כבר פוטרו מעבודתם כי ההודעות שלהם מצאו את דרכן למעבידים. חבר לעבודה קישר פתאום ביני לבין רשומת בלוג שהוא קרא שנה קודם לכן. את השם שלי אני מוצא בגוגל מדבר על טולקין בגיל 16, על דיוויד בואי בגיל 18, על XML בגיל 25. כל מילה שאנחנו אומרים מהדהדת. שכבות ארכיאולוגיות של כרזות פרסום ומודעות אישיות דבוקות לעמודים. כל דבר שאנחנו אומרים נשאב לו לתוך ביצת האינפורמציה הענקית שמקיפה אותנו ועלול לצוץ אחר כך במקום אחר או בזמן אחר. לפעמים בועת סרחון עולה מהמעמקים, לפעמים סתם חיוך נוסטלגי. אבל אי אפשר להתעלם מהעובדה שאנחנו חיים בתוך ארכיון ענקי שבונה את עצמו סביבנו, אפילו אם אנחנו לא תורמים לו אקטיבית.