شاید کسب و کار یاهو رو به افول رفته باشد، اما هنوز هم میلیونها نفر هر روز به این وبسایت سر میزنند و اخبار موجود را پیگیری میکنند. همواره این کمپانی بر روی خواندن و مرور کاربرانش تحقیقات زیادی را انجام میدهد. در تازه ترین آنها روز گذشته اعلام شد که این کمپانی دادههای عظیمی از عادات روزانه و مطالعات بیش از 20 میلیون کاربر خودش در بین ماههای فوریه و مه سال گذشته را در اختیار محققین زیربط قرار داده است. این اطلاعات عظیم شامل وبگردیهای کاربران در وبسایت اصلی یاهو، بخش اخبار ورزشی، فیلم، املاک و غیره تعداد کاربران ذکر شده میباشد.
بر اساس گزارشات یاهو، این داده ها یک مجموعه 13.5 ترابایتی و شامل 110 میلیارد داده خاص از اتفاقات افتاده توسط کاربران خواهد بود که یاهو از آن به عنوان بزرگترین مجموعه داده ای یادگیری ماشین یاد کرده است. همچنین یاهو عنوان کرده است که کمپانیهای دیگر حتی قادر به جمع آوری این میزان داده باورنکردنی در طول چند سال نیز نخواهند بود.
هرچند که این صحبتهای یاهو جنبههای تبلیغاتی نداشته و صرفاً اهداف پاکی را دنبال میکنند. چرا که این کمپانی، دادههای استخراج کرده خود را بدون هیچ گونه هزینهای در اختیار جامعه تحقیقاتی دانشگاهها قرار خواهد داد.علاوه بر آن، اینفوگرافی حدود 7میلیون کاربر شامل سن، جنسیت، مکان زندگی و سایر موارد (به جز نام) در اختیار این کمپانی است که بدون شک این اطلاعات به درد محققین خواهد خورد.