Українська правда
Економічна правда

Час прибирати інформаційне сміття

Артем Захарченко, ЕП — П'ятниця, 27 червня 2008, 13:50
Версія для друку Коментарі 4

До появи Мережі інформаційне сміття зосереджувалося в голові героїв, які "занадто багато знали". Тепер воно з кожним днем накопичується в пам'яті вашого комп'ютера, терабайтами осідає в Інтернеті.

Домогосподарки щодня смітять на форумах ввічливими або грубими неінформативними фразами. Вони примудряються вставити в порожню розмову саме ваші пошукові слова, і, відповідно, саме їх замість потрібної сторінки знаходить Google.

Старі, давно не оновлювані сайти. Просто погано зроблені ресурси з пропащим рейтингом. А ще потрібна інформація буває в недоступному форматі - це також сміття.

Біля вашого офісу риються в баках бородаті дядьки у рваних светрах. Загалом, в Інтернеті відбувається те саме, але за вашої участі.

Інтернет-суботник

Люди і машини смітять одночасно. Далеко не всі тимчасові файли автоматично витираються з комп'ютера, а користувачі взагалі не думають прибрати за собою. Вони не уявляють, що їхній старий сайт може комусь зашкодити.

Якщо у більшості непотрібних сторінок, розміщених на звичайному платному хостингу, за півроку-рік закінчується передплачений термін, і вони перестають завантажуватися. Однак багато IT-компаній безкоштовно розміщують некомерційні сайти, і їхню смерть відстежити складніше.

Загалом, якщо послухати представників провайдерів, виходить, що сміття цілком контролюється. Так, адміністратор сайту http://ho.com.ua, що надає безкоштовний хостинг, Наталя Власенко розповіла: "Кожні 3 місяці користувачеві приходить нагадування про те, що в нього є сайт на нашому хостингу, і пропозиція продовжити дію хостингу натисканням на посилання. Якщо користувач цього не робить, сайт автоматично видаляється. У такий спосіб видаляється більшість сайтів, що стали непотрібними".

До речі, мертві комерційні сайти також зустрічаються часто. Певно, вони були розміщені колись за знайомством, а потім були забуті. Але навіть після припинення хостингу сторінки ще тривалий час залишаються в кеш-пам'яті пошукових систем. Наскільки довго їх усе ще можна знайти і прочитати не беруться точно оцінити навіть адміністратори.

Програми сайтів-пошуковців час від часу "обходять" збережені адреси, і "якщо пошуковий робот не знайшов сторінку (помилка 404), то він ще двічі звернеться до неї під час наступних обходів, і якщо її не буде, то вона видаляється з пошукового індексу", - роз'яснив директор з розвитку бізнесу інтернет-агентства Mi[6] Олексій Танчик. Однак, за його словами, обхід сайтів не має часової періодичності.

Коли комп'ютер критично перевантажений, часто рекомендують перевстановити операційну систему. Але перевстановити Інтернет - це може бути, хіба що, гарним сюжетом для фантастичного оповідання.

Методів дієво "поприбирати" в Мережі немає. Тому громадяни-користувачі, різні творчі особистості, замість Інтернет-суботників влаштовують цілі сміттєві перформанси. На зразок сайту із сміттєвими кошиками, у який можна спустити будь-яку візуальну, знакову або текстову інформацію.

Інформаційні потоки замість архівів

У наші дні мережу все частіше уявляють як магістраль, центральними смугами якої мчить найактуальніша інформація, а все непотрібне й безглузде залишається на узбіччі. Загалом, цінність спілкування виявилася вище за цінність унікальної інформації.

Прийшов час безтурботного засмічення, якому не опираються навіть адміністратори. Та смітіть скільки завгодно, аби  ваше сміття читали тисячі людей! У блог-культурі цитування і крос-розміщення текстів це взагалі є ознакою ввічливості й уваги.

Тим часом пошукові сервери склеюють у пакети дедалі більшу кількість однакових сторінок, щоб видавати їх при пошуку одним результатом. Але ідеальний визначник схожих текстів технічно складний, тому що оточення тексту також на нього впливає. Тому однакових сторінок у пошуку все рівно більше й більше.

Такий самий безлад й у поштових серверах. Останнім часом майже всі вони роздули розмір скриньок до такої міри, що чистити вхідні листи вже немає сенсу.

Олексій Танчик відзначає, що вартість одного гігабайту постійно зменшується, тому для компаній нескладно забезпечити споживачів безрозмірною поштою.

Тим більше, що, за його словами, звичайні користувачі, як правило, не встигають заповнювати скриньки, розмір яких також зростає. У середньому в скриньках на сервері і.ua зберігається по 100-150 Мб листів.

Інтернет зовсім не схожий на бібліотеку. Це у ХХ столітті могли мріяти про глобальне вмістище всієї інформації людства, де кожна книга мала б своє унікальне місце.

Зараз працює формула "Більша частина інформації - сміття для більшої частини людей". І часто в розряд сміття потрапляє саме унікальна інформація, що не дістала достатньої уваги і не була перерозміщена.

Отож перспективи зменшення інформаційного сміття майже немає. Зате можна сподіватися, що шкоди буде від нього дедалі менше. Додатковий софт дозволятиме нам його не помічати.

Все про: IT

Коментарі — 4

Любко _ 08.07.2008 21:08
IP: 92.112.28.---
Якщо говорити про інформаційне сміття в інтернеті, то це в першу чергу СПАМ (95+% "обороту" всієї електронної кореспонденції) та нав*язлива реклама (банери та флеш-ролики). Так поставте собі файрфокс із фільтром реклами в якості доповнення і хороший антиспам фільтр (наприклад по алгоритму Байеса). Після цього найбільшим джерелом інформаційного сміття для вас стане телевізор на преса :))
Любко _ 08.07.2008 21:06
IP: 92.112.28.---
Автор статті потребує хорошого лікара.
Пошукові системи невпинно вдосконалюються прямо на очах. Ще декілька місяців назад можна було лише мріяти про таку фантастичну релевантність пошуку для поточного запиту. Треба лише розуміти суть інтернету і мотиви людей, що публікують в ньому інформацію для того, щоби правильно будувати запити.

Якщо говорити про інтернет в якості архіву чи бібліотеки, то десь з кінця 90-х років стало помітно вимирання всіх "альтруїстичних" і відкритих статтей і комерціалізація доступу до інформації. А що ви хочете, публікація власним потом і кров*ю здобутих результатів також грошей коштує.
В останні роки на теренах СНД просто бум інтернет-ресурсів, із самого початку сторених з метою заробляння грошей. І в цьому немає нічого поганого до тих пір поки існує певний баланс між бажанням заробити і порядністю.
Yamato _ 08.07.2008 14:21
IP: 62.80.179.---
Згоден - Інет давно перетворився на поток замість архіву. Знайти корисну інфу дво-трирічної давнини майже неможливо...
агент007 _ 05.07.2008 00:13
IP: 195.42.130.---
В чому основна думка статті ? Що Інтернет росте - давно всім відомо.. Що обсяги інформації ростуть - теж існує свій закон.

Колонки

Авторизація





Якщо ви новий читач, будь ласка, зареєструйтесь
Забули пароль?
Ви можете увійти під своїм акаунтом Facebook