18 червня 2014

Вычисляй и властвуй: шесть главных алгоритмов современности

Фотографія: Gwen Vanhee
 

 

 

Когда люди говорят о том, как сильно нас изменила IT-индустрия, обычно имеют в виду отдельные гаджеты, визионеров, придумавших их, или возможность всегда и везде рассматривать фото котиков. Но все на самом деле намного сложнее: в действительности на нашу жизнь в куда большей степени влияют компьютерные алгоритмы, которыми регулярно пользуются сотни миллионов людей по всему миру.

 

Google Search

Поисковик Google обрабатывает до 80% всех поисковых запросов в мире. Алгоритм, знакомый инженерам Google и IT-специалистам по названию PageRank, в настоящее время является самым эффективным поисковиком в мире. Он же является самым часто используемым алгоритмом в мире. И именно благодаря ему сайт Google.com стал окном в интернет для сотен миллионов пользователей.

 

Секрет успеха алгоритма – в том, что он работает в связке с интернет-«пауками», регулярно исследующими интернет на предмет появления в нем новых сайтов. Алгоритм же фильтрует найденные «пауками» ссылки по популярности, соответствию фразе, указанной в поисковой строке, и по многим другим параметрам.

 

Фотографія: Gwen Vanhee
 

 

IBM's CRUSH

Алгоритм Criminal Reduction Utilising Statistical History становится все более и более популярным среди полицейских Северной Америки. Он предназначен для прогнозирования времени и места возможного совершения преступлений в будущем (помните аналогичный механизм из фильма «Особое мнение»?). И он действительно работает. В 2010 департамент полиции из Мемфиса стал использовать этот алгоритм и рапортовал: благодаря этому уже в первый год число тяжких и особо тяжких преступлений в городе сократилось на 30%. Интерес к изобретению уже проявляют в Польше, Израиле и Великобритании.

 

CRUSH работает на основе анализа Big Data: на базе огромных массивов данных о том, какие преступления уже совершались в каких районах, система дает прогноз, где эти преступления могут случиться в ближайшем будущем. В особо горячие точки можно отправлять наряды милиции. Чуть что – они смогут прибыть на место преступления вовремя. В ближайшее время CRUSH сможет строить свои прогнозы не только на базе статистического анализа, но и руководствуясь сообщениями из социальных сетей, поисковыми запросами пользователей, а также распознавать отклонения в поведении граждан в реальном времени и так далее. «Большой брат» действительно вскоре будет следить за всеми нами. С другой стороны, пройдет несколько лет, и мир благодаря этому алгоритму почти наверняка станет намного безопаснее.

 

Facebook's News Feed

Этот алгоритм определяет, что будет видеть пользователь Facebook в своей ленте новостей в первую очередь, что – во вторую, а что – не увидит вообще. Какими именно принципами руководствуется для фильтрации этот алгоритм, доподлинно неизвестно до сих пор (мы уже бились над этим вопросом), хотя работа новостной ленты в Facebook у многих продолжает вызывать раздражение и поныне. Известно лишь, что Facebook ранжирует посты в соответствии с количеством комментариев к ним, «важности» автора для пользователя и так далее. Алгоритм сам выбирает, какие посты от френдов показывать пользователю в первую очередь. А поскольку Facebook уже заменил миллионам людей и новостные сайты, и форумы, и чаты, то во многом именно этот алгоритм создает медийный фон, по которому пользователь формирует собственное «объективное» мнение о реальности и том, что в ней происходит.

 

Фотографія: Gwen Vanhee

 

OKCupid Date Matching

Онлайн-знакомства сегодня – это индустрия объемом в $2 млрд в год. И – хорошие новости для Купидона – это растущая экономика. Растет она как минимум на 3,5% в год. Разумеется, все сайты знакомств используют для фильтрации анкет, которые могут понравиться пользователю, собственные алгоритмы.  OKCupid Date Matching – самый популярный из них. Он обслуживает самые мощные международные сайты знакомств – Match.com, eHarmony и OKCupid.

 

Разработчиком алгоритма стал математик из Гарвардского университета Кристиан Раддер. Его алгоритм использует при выборе потенциальных партнеров пользователю аналитический подход: в первую очередь, желающему познакомиться кавалеру предлагают написать дамам, имеющим схожие с ним интересы. И наоборот.

 

NSA Data Collection

Про то, что Агентство национальной безопасности США следит за всеми интернетчиками в мире, мы и так знаем – спасибо Эдварду Сноудену. Алгоритм, который использует ведомство, позволяет собрать о нас всю возможную информацию в интернете в одно досье. В документ войдут данные о наших телевизионных звонках, электронных письмах и даже изображения с веб-камер и GPS-данные о наших перемещениях. Вопреки воле пользователей, все они оказались «под колпаком». Собирает и систематизирует эти данные сверхсложный алгоритм АНБ.

 

Фотографія: Gwen Vanhee 

Google AdWords

Google является фактическим монополистом и главным продавцом рекламы в интернете. Залог успеха ее сервиса AdWords – крайне умный «алгоритм», который умеет подсчитывать стоимость рекламы, определять ее эффективность и, главное, демонстрировать пользователю те рекламные блоки, которые его больше всего интересуют. Для определения «интересных» рекламных объявлений алгоритм сканирует историю поиска и интернет-серфинга пользователя, содержание его писем на Gmail и так далее. Ни у одной другой компании нет алгоритма, который мог бы превзойти AdWords на этом рынке. Он же стал основой финансового благополучия Google.

 

 

Что ж, а нам остается только надеяться, что какой-нибудь особенно умный алгоритм не захочет разыграть сценарий из «Терминатора» или «Матрицы».


comments powered by Disqus