Народ-блогоносец

Автор: Захаров, Павел
Опубликовано в журнале "Компьютерра" №27-28 от 01 августа 2007 года

По мере проведения исследований выявляется множество удивительных общих свойств сетей столь разного происхождения. Например, очень многие сети являются "малыми мирами", поскольку путь от одного узла к другому зачастую намного меньше ожидаемого интуитивно. Один из самых известных экспериментов в истории социологии, проведенный психологом из Гарварда Стэнли Милгрэмом в 1967 году, показал, что жителей США объединяет цепочка в среднем из пяти знакомых или шести рукопожатий. Парадоксальность полученного результата привела к быстрой популяризации концепции малого мира, которая позже была продемонстрирована для сетей совместных съемок актеров и сотрудничества ученых. А недавно в процессе изучения русскоязычного сегмента LiveJournal наша группа из Швейцарского университета Фрибурга выяснила, что эта сеть - еще более тесный мир, где всех пользователей разделяет цепочка в среднем в 4,3 рукопожатия.

МИНИАТЮРНАЯ ВСЕЛЕННАЯ

Исследования сложных сетей уже давно стали одной из горячих тем, обсуждаемых на страницах не только научных, но и популярных журналов. Не раз обращалась к ним и "КТ". Интерес отчасти связан с близостью и осязаемостью изучаемых этой наукой объектов. К ним относятся и Интернет, и электрические сети, и сети взаимодействия белков, и сети совместной работы актеров, ученых и бизнесменов.

 конце 90-х группа физиков из Университета Нотр-Дам (США) под руководством Альберто Барабаши предприняла попытку определить, насколько мал мир веба, то есть сколько в среднем требуется кликов, чтобы перейти от одной веб-страницы к другой. Оказалось, что уже в далеком 1999 году кликов требовалось всего лишь девятнадцать. Благодаря этой работе была сделана еще одна чрезвычайно важная и неожиданная находка - самоподобие структуры веба. Распределение количества ссылок, размещенных и указывающих на веб-страницы, спадает по степенному закону, что приводит к так называемому эффекту "толстого хвоста" распределения - наличию значительного количества страниц с чрезвычайно большим количеством ссылок.

С тех пор пошло-поехало: класс малых безразмерных сетей стал пополняться все новыми и новыми типами сетей окружающего нас мира. И вот, наконец, ученые снова взялись за самые сокровенные сети - сети человеческих взаимоотношений, или, попросту, социальные сети. Произошло это во многом благодаря набравшим популярность в последние годы блог-сервисам со встроенной поддержкой социальных связей, которым удалось накопить гигантские базы виртуальных взаимоотношений пользователей. Некоторые из них, такие как безусловный лидер в России - LiveJournal, или Живой Журнал, даже не думают скрывать свои базы ни от

праздного наблюдателя, ни от сетевого исследователя и более того - поддерживают бот-интерфейс, заметно упрощающий сбор данных. Эта возможность и была использована нашей группой для изучения доступной сети френдования1 LiveJournal. В LJ на момент написания статьи (май 2007 года) зарегистрировано больше 12 млн. пользователей, 1,8 млн. из которых, по сведениям LJ, активны. Начав с нескольких активных пользователей и исследуя все исходящие дружеские связи, краулер способен в течение некоторого времени собрать данные о более чем 4,3 млн. пользователей, пока не будут исчерпаны все ссылки. Этот блок сети, составляющий ее основную и самую важную часть, называют сильно связанным компонентом. Когда вся информация собрана исохранена на локальном компьютере, она может быть досконально исследована методами анализа графов.

Итак, является ли социальная сеть LJ "малым миром"? Оказывается, да. Конечно, LJ - очень тесный мир, где один пользователь соединен с другим цепочкой в среднем из пяти друзей. То есть требуется шесть шагов по друзьям, чтобы, начав с одного, достичь любого другого пользователя. Не правда ли, удивительное совпадение с легендарными шестью рукопожатиями Милгрэма?

АРХИПЕЛАГ ЖЖ

Но на этом неожиданности не заканчиваются. Что представляет собой подобная сеть?
Является ли она бессистемным переплетением связей, то есть случайной сетью, или ее структурой все же управляют некие скрытые законы. Читатель, знакомый с LiveJournal, тут же отметит, что кириллический ЖЖ [Я намеренно использовал термин "кириллическое" сообщество, а не "российское" или "русскоговорящее", поскольку оно не ограничивается определенной страной, национальностью или языком. Как правило, его составляют выходцы из стран бывшего СССР и Израиля, которые, однако, могут географически находиться где угодно. В дальнейшем под ЖЖ будет подразумеваться именно этот сегмент, а под LJ - сеть в целом] и остальной, преимущественно англоязычный LJ - совершенно разные сущности, и будет прав. Они лишь функционируют внутри одной программной системы, и собраны нами в один большой граф. Есть ли возможность разделить их, пользуясь лишь имеющейся информацией о дружеских связях?

Вспомним, что в виртуальной реальности блог-сервиса дружеские связи - это каналы распространения информации. Поместил, например, пользователь Петя в свой журнал новый анекдот, прочитали его друзья, возможно, скопировали себе, их друзья тоже почитали, посмеялись и скопировали в свои журналы и так далее. Анекдот начал свою диффузию по сети (рис. 1).

РИС. 1. Объяснение алгоритма на примере диффузии

Почему диффузию? Потому что процесс описывается похожими законами, как и распространение эпидемий, и случайное блуждание по сети. Естественно, что кто-то прочтет этот анекдот одним из первых, кому-то он попадется во френдленте не один раз. Но будут и те, кто узнает о нем позже других, в силу того, что живет на другом "острове" социальной сети и его связь с остальным миром поддерживает лишь небольшое количество социальных цепочек.

Самый яркий пример подобного "острова" в сети - сообщество пользователей онлайновой RPG-игры Must Be Pop (community.livejournal.com/must_be_pop), насчитывающее более 15 тысяч членов. Выберите любого из членов этого сообщества и попробуйте добраться до первого известного вам журнала ЖЖ, переходя по дружеским связям. Сколько кликов потребуется? Если вы будете блуждать, не зная пути, то в среднем потребуется больше 111 кликов. Специфика членов этого сообщества в том, что они ведут вымышленные дневники реальных знаменитостей.

Не удивительно, что френдят и читают их, как правило, лишь другие поклонники этой игры. Отсюда и замкнутость.
Обнаружить подобный "остров" и определить границы этого обособленного ареала блоггеров позволяют все те же краулеры [Идея исследования веба при помощи произвольно блуждающих краулеров использована также и в алгоритме PageRank,  определяющем рейтинг страниц для поисковика Google]. Если в среднем требуется 111 переходов, чтобы покинуть сообщество, и диаметр всей сети LJ равен шести, то мы почти наверняка можем быть уверены, что после, скажем, двух десятков переходов большинство отправленных краулеров останется внутри сообщества и лишь немногие успеют его покинуть. При этом количество краулеров, застигнутых на конкретном пользователе, поделенное на число входящих дружеских связей, - величина постоянная для всех членов сообщества, которая может быть использована для проверки принадлежности пользователя к тому или иному сообществу.

Вернемся теперь к кириллическому ЖЖ и отправим краулеры блуждать, начав с какого-нибудь известного блоггера - например, с журнала doctor_livsy, принадлежащего Сергею Лукьяненко. Ничто не мешает нам отправить вторую команду с отдаленного от ЖЖ пользователя, скажем, с журнала future_visions. Тогда для каждого пользователя LJ можно подсчитать количество краулеров того или иного семейства, остановившихся на нем на определенном шаге. Чем краулеров больше - тем ближе пользователь к их источнику. Распределение пользователей по количеству обнаруженных на их узлах краулеров можно представить графически в виде двухмерной карты.

Первое, что бросается в глаза, - наличие двух ярких "островов" пользователей, меньший из которых на поверку оказался группой кириллических пользователей ЖЖ, поскольку примерно 98% из ее участников используют кириллицу в своих журналах или комментариях. Анализ обнаруженной группы показал, что лишь один из каждых ста друзей пользователей ЖЖ находится вне кириллического сегмента. То есть в среднем потребуется 100 случайных кликов, прежде чем мы сможем покинуть ЖЖ и оказаться в англоговорящем LJ. Результат немногим уступает рекорду Must be Pop.

РУССКИЕ ЛИДЕРЫ

Что же препятствует установлению связей между ЖЖ и LJ? Первая и самая очевидная причина - языковой барьер. Не настолько распространено знание иностранных языков среди пользователей ЖЖ, как, например, среди немецких или французских языковых меньшинств. Однако дело не только в этом. В большинстве своем стиль дневников ЖЖ кардинально отличается от стиля журналов LJ, что опять-таки подтвердит любой более-менее знакомый с темой читатель. Как отмечал сам создатель LJ Брэд Фитцпатрик, типичный журнал ориентирован на десяток близких друзей в реальной жизни. Френдование виртуальных знакомых происходит крайне редко. В ЖЖ при этом значительная часть пользователей читает журналы людей, с которыми они лично не знакомы. Соответственно, и манера ведения журналов отличается от повседневных постов в частные дневнички. Самые известные и популярные журналы в ЖЖ принадле-жат писателям, журналистам, политическим активистам и обозревателям, так называемым тысячникам. Характерно, что в ЖЖ могучая кучка тысячников гораздо более многочисленна, чем в сети в целом. Забавно, что в ЖЖ тысячником является примерно каждый тысячный пользователь, тогда как в LJ таковых можно насчитать лишь по одному на 19 тысяч пользователей. Более того, в ЖЖ можно обнаружить десятитысячников, то есть тех, кого зафрендили больше 10 тысяч человек. Этих суперзвезд, правда, всего три. Во-первых, уже упомянутый doctor_livsy - журнал фантаста Сергея Лукьяненко, который популярен в значительной степени из-за офлайн-известности автора. Во-вторых, drugoi - "иллюстрированный журнал обо всем на свете" дизайнера Рустема Адагамова, где привлекает качественный и интересный контент. И, наконец, toster - плод социального эксперимента московского программиста Антона Волнухина, чьей целью было всеми возможными способами набрать как можно больше друзей. Во всем прочем LJ имеется лишь один десятитысячник - анонимный журнал I Harth Darth с регулярными комиксными лентами. За ним следует журнал-дневник фотомодели Elyse Sewell (7490 читателей) и заброшенный еще два года назад журнал The Quiz Diva (5669) с онлайн-тестами, в большинстве своем эротического содержания.

РИС. 2. Степенной закон распределения количества друзей в ЖЖ

Как мы видим на рис. 2, хвост распределения популярности в ЖЖ значительно "толще", чем в LJ. Более того, распределение описывается степенным законом с тем же показателем 3, что и распределение для веба, обнаруженной группой Барабаши. Подобного рода сетевая геометрия была объяснена моделью копирования ссылок при росте сети. Суть этого механизма применительно к ЖЖ заключается в том, что новичок в блогосфере френдит других пользователей, исходя в основном из их популярности.При этом вероятность френдования того или иного участника прямо пропорциональна количеству уже зафрендивших его пользователей. Популярный пользователь со временем становится еще популярнее, или, как это иногда называют, "деньги идут к деньгам".

В остальном LJ такой процесс тоже имеет место, но его эффект гораздо менее выражен. Предыдущие исследования американского сектора LJ не обнаружили самоподобия структуры. Напротив, оказаось, что социальная сеть американских пользователей близка к обычной офлайновой социальной сети. То есть еще раз подтверждается, что этот сектор базируется на реальных, а не виртуальных знакомствах.

Но вернемся к пользователю toaster, основным методом которого было добавлять в друзья, чтобы быть добавленным в ответ. Исследование показало, что в среднем 80% дружеских связей в LJ взаимны, поэтому подобная стратегия набора читателей для своих дневников активно практикуется в ЖЖ. В результате количество друзей у среднестатистического представителя ЖЖ в два раза больше, чем у обитателя остальной части LJ. Если там каждый пользователь обладает в среднем шестнадцатью друзьями, то для ЖЖ этот показатель составляет 32. Еще заметнее это по размеру второго круга пользователя ЖЖ, то есть по "друзьям друзей". В среднем по сети размер второго круга - 540 пользователей, но в ЖЖ он порядка 3000. Таким образом, ЖЖ представляет собой плотно переплетенный клубок, в котором типичное расстояние между двумя журналами - 4,3 шага.

МИФ О ДЕЦЕНТРАЛИЗАЦИИ

Процесс распространения информации аналогичен распространению эпидемий, лесных пожаров и формированию структуры геля. И это не только метафора, поскольку все эти процессы описываются одними и теми же уравнениями. Ранее исследователями было показано, что в сети, где узлы соединены совершенно случайно, без какого бы то ни было порядка, существует некий критический порог заразности болезни, называемый порогом перколяции. Если заразность болезни не превышает этот порог, эпидемия локализуется в некоей области сети и не распространяется дальше. Если порог пройден - эпидемия превращается в пандемию, и ею оказывается охвачена вся сеть, какой бы большой она ни была. Вспомните, как варится яйцо, - долгое время белок остается жидкой массой, пока вдруг, практически мгновенно, не превращается в упругое вещество, способное сохранять форму. Происходит это в тот момент, когда белки, составляющие яичный белок, объединяются в структуру, охватывающую весь яичный белок, перколируют. Оказалось, что в безмасштабных сетях этот порог отсутствует, то есть даже при минимальной заразности болезни она способна пробить себе дорогу ко всей сети. Для того чтобы воспрепятствовать распространению некоей новости, необходимо, чтобы почти 100% пользователей ее проигнорировали. Однако чтобы остановить новость организованным бойкотом, необходима поддержка группы из всего лишь 0,2% наиболее популярных пользователей, то есть тех, кто во френдах у более чем 750 человек. Если же вообще удалить этих пользователей из сети, ЖЖ попросту развалится на отдельные кластеры.

 

МЕНТАЛЬНОСТЬ В ГРАФАХ

Все упомянутые численные метрики сказываются на повседневной жизни ЖЖ. Вспомним, что пользователи - это не абстрактные узлы в сети, а живые люди, общающиеся и обменивающиеся мнениями в своих и чужих журналах. Они обсуждают, спорят, ссорятся, мирятся, делятся своими знаниями и здесь же черпают их, распространяют свои заблуждения и оказываются под влиянием чужих. В этом плане ЖЖ сравним с огромной нервной системой, где люди играют роль нейронов, распространяя по своим социальным связям нервные информационные импульсы, которые, проходя через многие журналы, фильтруются и перевариваются. Порой таким образом появляются образцы народной мудрости, полученные усилиями стихийных "мозговых штурмов". Иногда же определенные веяния, преодолевая некоторый порог, превращаются во флэш-мобы, информация о которых в кратчайшие сроки доносится практически до всех активных пользователей. Основной механизм флэш-моба - копирование чужих записей себе в журнал - по своему принципу ничем не отличается от копирования друзей, описанного ранее, и ЖЖ вновь оказывается уникальным в своей способности распространять повторяющуюся информацию благодаря самоподобной структуре (см. врезку).

Хотя сценарий развития общения в ЖЖ и зависит от индивидуальных качеств составляющих сеть пользователей, значительную роль здесь играет структура. Влияние последней можно изучить моделированием "динамики мнений" в социальной сети, заменив пользователей LJ на виртуальные автоматы, которые действуют по заранее заданному алгоритму, имитирующему мышление пользователей, и проследить, как будут формироваться мнения в подобной системе.

Этот подход уверенно набирает популярность и является наглядным примером сближения методов социологии и физики. Виртуальные ЖЖ-пользователи в модели имеют определенное мнение, выраженное неким числом. Предположим для простоты, что –1 соответствует резко отрицательному, +1 - резко положительному, а 0 - нейтральному мнению о некоемпредмете. Мнение автоматов не остается постоянным, оно меняется с течением времени в результате обсуждения с друзьями.

На каждом шаге моделирования автомат "выслушивает" мнения всех своих друзей, определяет среднее значение их численного мнения и делает некоторый шаг от своего текущего мнения к этому среднему. Пусть этот шаг будет равен половине разницы. Резонно предположить, что независимо от набора исходных данных рано или поздно автоматы придут к единому мнению. Начав же с одинакового для всех нейтрального мнения, они при нем и останутся. Однако же люди в реальном мире руководствуются не только чужими мнениями, они думают и приходят к самостоятельным выводам, получают информацию извне, да и просто порой неправильно понимают своих друзей и их мнение. Все это приводит к иррациональному поведению с точки зрения модели, которое тоже можно учесть, добавив шум. Пусть иногда, относительно редко (раз на тысячу обсуждений), робот меняет свое мнение на совершенно иное. В случайной сети это тоже не составляет большой проблемы: "оригинал" относительно быстро вернется к общепринятому мнению, не сильно повлияв на среднее.

Однако в данном случае наблюдается интересное явление: ЖЖ перестает быть в согласии с остальным LJ. В то время какструктура социальной сети англоязычного LJ подавляет иррациональное мнение своих "заблуждающихся" и сохраняет устойчиво нейтральное мнение, ЖЖ подвержен относительно резким отклонениям от средневзвешенного в обе стороны. И хотя среднее мнение пользователей никогда не доходит до экстремальных уровней, в большинстве случаев, исходя из мнения конкретного пользователя, можно практически безоши- бочно определить, к какому сообществу он принадлежит.

Причиной такого поведения является все тот же "толстый хвост" - слишком много чрезвычайно популярных пользователей. Достаточно одному из них иррационально изменить собственное мнение, и за ним потянется большое количество людей, которые, в свою очередь, потянут других, за френдивших уже их, и т. д. И хотя виновник недоразумения вскоре вернется к более взвешенному мнению, эффект уже будет достигнут - среднее мнение сообщества изменится и ЖЖ удалится от остального LJ. Тут свою роль сыграет слабая связанность ЖЖ с остальным LJ. Вспомним, что лишь одна из ста дружеских связей в ЖЖ присоединяет ЖЖ к LJ, чего явно недостаточно, чтобы обеспечивать эффективный обмен мнениями между этими сообществами. Что же следует из результатов подобного моделирования? Во-первых, как ни печаль но это осознавать, но даже абсолютное внимание к мнениям окружающих и готовность адаптировать свое мнение к мнению большинства не спасает нас от глобального недопонимания, если общество разобщено, как разделены ЖЖ и LJ. Присутствие людей, обладающих значительным влиянием на общественное мнение, выступает дестабилизирующим фактором и углубляет разрыв, даже если эти люди не имеют злого умысла. Следует учесть, что мы проанализировали очень грубую модель, лишь отдаленно повторяющую реальный социум. Добавление в модель людей, намеренно и еленаправленно вводящих окружающих в заблуждение, а также "экстремистов", неохотно меняющих свое мнение, может значительно усугубить ситуацию. В LJ многочисленные пользователи, имеющие примерно равный ранг популяр- ности, эффективно сглаживают откло- нения именно за счет демократичности структуры. В кириллическом ЖЖ тысячники оказывают гораздо большее влияние на настроения в ЖЖ, которое лишь частично компенсируется большинством рядовых пользователей, оригинальные мнения ко- торых, напротив, могут легко затеряться и не быть услышанным. Происходит естественное разграничение пользователей на пишущее меньшинство и читающее большинство - ситуация, обычная для мира вне Интернета. Нам свойственно винить правительства, государственные границы, разницу уровней жизни в недопонимании других народов, однако в виртуальной среде, где все равны и отсутствуют межгосударственные границы и диктат политических систем [Возможно, не совсем верно ограничивать влияние политических систем офлайн-жизнью граждан. - Прим. ред.], мы продолжаем привычно обособляться, формируя свой субкультурный анклав. При этом, как в случае ЖЖ, сама собой выстраивается иерархическая система, где некое меньшинство "избранных" наделяется несоразмерно большим влиянием, степень которого даже трудно вообразить. Во благо или во вред подобные особенности - вопрос с долгой историей, так и не получивший точного ответа. 


<<Улики под сомнением
Все материалы номера
Обыкновенная история >>