Нажмите "Enter", чтобы перейти к содержанию

Основание руси википедия: HTTP 429 — too many requests, слишком много запросов

Содержание

Автоматическая оценка качества статей Википедии на разных языках / Хабр

Предлагаю Вашему вниманию обзорную статью научных работ, в которых я являюсь непосредственным участником и автором, на тему оценки качества Википедии на разных языках. Свои научные публикации на эту тему я пишу в основном на английском и польском языках. Я решил поделиться своими знаниями и опытом в этой области для русскоязычной аудитории, и выбрал Хабрахабр для первой такой статьи. Буду рад услышать комментарии и предложения на данную тему, возможно кто-то будет заинтересован в сотрудничестве в этом направлении. В следующих статьях я планирую более подробно остановиться на отдельных методиках и алгоритмах по анализу качества статей на разных языках. Также планирую размещать примеры кода (в основном Python), которые могут пригодиться для извлечения и анализа данных из Википедии.


Несмотря на то, что Википедия часто критикуется за ее низкое качество, она по-прежнему остается одной из самых популярных баз знаний в мире. В настоящее время эта интернет энциклопедия находится на 5 месте среди наиболее посещаемых сайтов в мире (после Google, Youtube, Facebook, Baidu). Статьи в данной энциклопедии создаются и редактируются на около 300 разных языках. В настоящее время Википедия содержит более 46 миллионов статей, охватывающих различные темы.

С каждым днём количество статей в Википедии растет. Они могут создаваться и редактироваться даже анонимными пользователями. Авторам не нужно формально демонстрировать свои навыки, образование и опыт в определенных областях. В Википедии нет центральной редакции или группы рецензентов, которые могли бы комплексно проверять все новые и существующие тексты. По этим и другим причинам люди часто критикуют концепцию Википедии, в частности, указывая на низкое качество информации.

Несмотря на это в Википедии можно иногда встретить ценную информацию — в зависимости от языковой версии и тематики. Практически в каждой языковой версии существует система наград для наилучших статей. Однако, таких статей очень мало (меньше одного процента). В некоторых языковых версиях существует возможность выставлять также другие оценки качества. Однако, подавляющая доля статей не имеет оценок (в некоторых языках более 99%).

Автоматическая оценка качества статей Википедии

Итак, в Википедии много статей не имеют оценок качества, поэтому каждый читатель должен самостоятельно анализировать их содержимое. Тема автоматической оценки качества статей Википедии в научном мире не нова. В основном, научные работы касаются самой развитой языковой версии Википедии — английской, которая уже содержит более 5.5 миллионов статей. Мною исследуются разные языковые версии Википедии: английская, русская, польская, белорусская, украинская, немецкая, французская и др.

С момента основания и с ростом популярности Википедии появляется всё больше и больше научных публикаций на эту тему. Одно из первых исследований показало, что измерение объема содержимого может помочь определить степень «зрелости» статьи. Работа в этом направлении показывает, что в целом более качественные статьи являются длинными, используют ссылки согласованным образом, редактируются сотнями авторов и имеют тысячи редакций (версий).

Как приходят к подобным заключениям? Проще говоря: сравнивают между собой хорошие и плохие статьи.

Как уже вспоминалось ранее, практически в каждой языковой версии Википедии существует система оценок качества статей. Самые лучшие статьи награждаются особым способом — получают специальный «значoк». В русской Википедии такие статьи называются «Избранные статьи» (ИС), в английский Википедии — «Featured Articles». Есть ещё другой «значок» для статей, которые немного не «дотягивают» до избранных — «Хорошие статьи» (ХС) (в английской версии — это «Good Articles»). В некоторых языковых версиях существует и другие оценки для более «слабых» статей. Например, в русской Википедии есть ещё: Добротная, Полная, Развитая, В развитии, Заготовка. В английской версии можно встретить ещё: A-class, B-class, C-class, Start, Stub.

Уже на примере английской и русской версий, можно сделать вывод, что стандарты к градации оценок различны в зависимости от языка. Более того, далеко не все языковые версии Википедии имеют такую развитую систему оценок качества статей. Например, немецкая Википедия, которая содержит более 2 млн статей, использует только две оценки — аналоги ИС и ХС.

Поэтому часто оценки в научных работах объединяют по двум группам:[1][2][3][4][5][6][7]

  • «Полные» — оценки ИС и ХС,
  • «Неполные» — все остальные оценки.
Назовем этот метод «бинарным» (1 — Полные статьи, 0 — Неполные статьи). Такое разделение естественно «размывает» границы между отдельными классами, однако позволяет строить и сравнивать модели качества для разных языковых версий Википедии.

Data Mining

Для построения таких моделей можно использовать различные алгоритмы, в особенности Data Mining.
В своих работах, я часто использую один из наиболее распространённых и эффективных алгоритмов — Random Forest[1][2][3][4][5][6][7] («Случайный лес»). Имеются даже исследования[4], которые сравнивают его с другими алгоритмами (CART, SMO, Multilayer Perceptron, LMT, C4.5, C5.0 и др.). Случайный лес позволяет строить модели даже с использованием независимых переменных, которые коррелируют друг с другом. Дополнительно, данный алгоритм может показать, какие именно переменные являются более значимые для определения качества статей. Если нам необходимо получить другую информацию о важности переменных, можно использовать другие алгоритмы, в том числе логистическую регрессию[13].

Результаты показывают, что существуют различия между моделями качества статей в разных языковых версиях Википедии

[1][2][3][4]. Таким образом, если в одной языковой версии одним из наиболее важных параметров является количество примечаний (источников), в другом языке более важным будет количество изображений и длина текста.

Таким образом, качество моделируется, как вероятность отнесения статьи к одной из двух групп — Полные или Неполные. Вывод делается на основании анализа различных параметров: длина текста, количество примечаний, изображений, разделов, ссылок на статью, количество фактов[6], посещение, количество редакций и многих других. Имеется также ряд лингвистических параметров[5][7], которые зависят от рассматриваемого языка. В настоящее время суммарно в исследованиях используется более 300 параметров, в зависимости от языковой версии Википедии и сложности построенной модели. Некоторые параметры, такие как примечания (источники), могут оцениваться дополнительно

[14] — то есть не только считать количество, а также оценивать насколько известные и надежные источники используются в статье Википедии.

Откуда взять эти параметры?

Источников несколько — это может быть резервные копии Википедии, сервис API, специальные инструменты и другие[12].

Для получения некоторых параметров необходимо просто отправить запрос в соотвествующий API, для других параметров (особенно лингвистических) необходимо использовать специальные библиотеки и парсеры. Значительная часть времени, однако, уходит на написание своих инструментов (на этом остановимся в отдельных статьях).

Существуют ли другие способы оценки качества статей кроме бинарного?

Да. В недавних исследованиях[8][9] предлагается способ оценки статей по шкале от 0 до 100 (как непрерывная оценка). Таким образом, статья может может получить, например, оценку 45.78. Этот способ протестирован на 55 языковых версиях. Результаты доступны в сервисе ВикиРанк, который позволяет оценивать и сравнивать качество и популярность статьи Википедии на разных языках. Способ, конечно, не идеален, но работает для локально известных тематик
[9]
.

Есть ли способы оценивания качества не всей статьи Википедии, а ее части?

Конечно. Например одним из важных элементов статьи является так называемая «карточка» (infobox). Это отдельная рамка (таблица), которая расположена часто справа вверху статьи и показывает наиболее важные факты о субъекте. Таким образом, нет необходимости искать в тексте эту информацию — достаточно взглянуть на эту карточку. Оценке качества этих карточек посвящены отдельные исследования[2][11]. Существуют также проекты, такие как Infoboxes, которые позволяют автоматически сравнивать карточки в разных языковых версиях.

Зачем это всё?

Википедией пользуются часто, но не всегда проверяют качество информации. Предложенные методы могут упростить эту задачу: если статья является плохой, тогда пользователь, зная это, будет более осторожным в использовании ее материалов для принятия решений. С другой стороны, пользователь также может видеть, на каком языке интересующая его тема описана лучше. И самое важное, современные методики позволяют переносить информацию между различными языковыми версиями. Это означает, что можно автоматически обогатить слабые версии Википедии информацией высокого качества из других языковых версий[11]. Также это позволит повысить качество других семантических баз данных, для которых Википедия является основным источником информации. Прежде всего, это — DBpedia, Wikidata (Викиданные), YAGO2 и другие.

Источник иллюстраций — [8]

Литература


  • [1] Lewoniewski, W., Węcel, K., & Abramowicz, W. (2016). Quality and Importance of Wikipedia Articles in Different Languages. In International Conference on Information and Software Technologies (pp. 613-624). Springer International Publishing. DOI: 10.1007/978-3-319-46254-7_50
  • [2] Węcel, K., & Lewoniewski, W. (2015). Modelling the quality of attributes in Wikipedia infoboxes. In International Conference on Business Information Systems (pp. 308-320). Springer International Publishing. DOI: 10.1007/978-3-319-26762-3_27
  • [3] Lewoniewski, W., Węcel, K., & Abramowicz, W. (2015). Analiza porównawcza modeli jakości informacji w narodowych wersjach Wikipedii. Prace Naukowe/Uniwersytet Ekonomiczny w Katowicach, 133-154.
  • [4] Lewoniewski, W., Węcel, K., Abramowicz, W. (2017), Analiza porównawcza modeli klasyfikacyjnych w kontekście oceny jakości artykułów Wikipedii, Matematyka i informatyka na usługach ekonomii, Wydawnictwo UEP Poznań, ISBN 9788374179386
  • [5] Khairova, N., Lewoniewski, W., & Węcel, K. (2017). Estimating the quality of articles in Russian Wikipedia using the logical-linguistic model of fact extraction. In International Conference on Business Information Systems (pp. 28-40). Springer, Cham. DOI: 10.1007/978-3-319-59336-4_3
  • [6] Lewoniewski, W., Khairova, N., Węcel, K., Stratiienko, N., & Abramowicz, W. (2017). Using Morphological and Semantic Features for the Quality Assessment of Russian Wikipedia. In International Conference on Information and Software Technologies (pp. 550-560). Springer, Cham. DOI: 10.1007/978-3-319-67642-5_46
  • [7] Lewoniewski, W., Wecel, K., & Abramowicz, W. (2017). Determining Quality of Articles in Polish Wikipedia Based on Linguistic Features.
    DOI: 10.20944/preprints201801.0017.v1
  • [8] Lewoniewski, W., Węcel, K., & Abramowicz, W. (2017). Relative Quality and Popularity Evaluation of Multilingual Wikipedia Articles. In Informatics (Vol. 4, No. 4, p. 43). Multidisciplinary Digital Publishing Institute. DOI: 10.3390/informatics4040043
  • [9] Lewoniewski, W., & Węcel, K. (2017). Relative quality assessment of Wikipedia articles in different languages using synthetic measure. In International Conference on Business Information Systems (pp. 282-292). Springer, Cham. DOI: 10.1007/978-3-319-69023-0_24
  • [10] Lewoniewski, W. (2017). Enrichment of Information in Multilingual Wikipedia Based on Quality Analysis. In International Conference on Business Information Systems (pp. 216-227). Springer, Cham. DOI: 10.1007/978-3-319-69023-0_19
  • [11] Lewoniewski, W. (2017). Completeness and Reliability of Wikipedia Infoboxes in Various Languages. In International Conference on Business Information Systems (pp.
    295-305). Springer, Cham. DOI: 10.1007/978-3-319-69023-0_25
  • [12] Lewoniewski, W., Węcel, K., (2017), Cechy artykułów oraz metody ich ekstrakcji na potrzeby oceny jakości informacji w Wikipedii. Studia Oeconomica Posnaniensia 12/2017. DOI: 10.18559/SOEP.2017.12.7
  • [13] Lamek, A., Lewoniewski, W. (2017), Zastosowanie regresji logistycznej w ocenie jakości informacji na przykładzie Wikipedii. Studia Oeconomica Posnaniensia 12/2017. DOI: 10.18559/SOEP.2017.12.3
  • [14] Lewoniewski, W., Węcel, K., Abramowicz, W., (2017), Analysis of References across Wikipedia Languages. Information and Software Technologies. ICIST 2017. DOI: 10.1007/978-3-319-67642-5_47

Наука начинается с библиотеки

777

Добавить в закладки

Сегодня отмечают Общероссийский день библиотек, приуроченный к дате основания первой государственной общедоступной библиотеки России, ныне известной как Российская национальная библиотека.

27 мая 1795 г. Екатерина II высочайшим повелением одобрила проект постройки в Санкт-Петербурге здания Императорской публичной библиотеки — первой общедоступной библиотеки России. Место для ее размещения выбрали в самом центре столицы Российской империи — при пересечении Сенной (Большой Садовой) улицы с Невским проспектом, что значительно способствовало общественному просвещению, так как покупку книг в то время мог позволить себе не каждый россиянин ввиду их дороговизны. Подобно европейским публичным библиотекам, Императорской публичной библиотеке предстояло стать собирательницей всех российских книг и рукописей. С ее появлением началась новая глава в истории науки, культуры и образования. По этой причине 27 мая указом президента Российской Федерации Б.Н. Ельцина в 1995 г. был установлен Общероссийский день библиотек, отмечающий их большой вклад в развитие отечественного просвещения, науки и культуры и необходимость дальнейшего повышения значимости роли книг в жизни общества.

Российская национальная библиотека, Санкт-Петербург. Фото: A.Savin / Википедия

 

Роль библиотек в развитии науки и культуры

В ходе развития человеческой цивилизации, культуры и выработки новых смыслов возникла необходимость объединения накопленного опыта. Так сначала появились книги, а затем и библиотеки. В одной из своих лекций библиотековед К.И. Рубинский более 100 лет назад (в 1909 г.) отмечал, что «библиотека является фактором человеческой культуры», именно в ней, как в зеркале, отражается культурная жизнь общества. По мнению К.И. Рубинского, библиотека — средство к развитию просвещения, без библиотеки немыслимо также и развитие науки. Сегодня выделяют разные функции библиотек, но одними из основных по-прежнему остаются кумулятивная функция, проявляющаяся посредством собирания и хранения книг и других документов, и трансляционная, обеспечивающая передачу накопленной информации.

Российская государственная библиотека. Фото: Vladimir Tokarev / Википедия

 

Самыми богатыми книжными собраниями располагают национальные библиотеки. Помимо Российской национальной библиотеки в Санкт-Петербурге, такой же статус имеет Российская государственная библиотека, расположенная в Москве. Эти библиотеки несут наибольшую ответственность за сохранение национальной культуры. Ведь в хранящихся там документах и книгах запечатлены исторические события, достижения науки, искусства и др. Советский философ и культуролог В.М. Межуев отмечал, что национальная культура накапливается не столько в естественной памяти человека, сколько в искусственно созданных хранилищах музейных коллекций, архивах, библиотеках и пр. Если попытаться измерить количественно объем национальной культуры, то именно единицы библиотечного, архивного, музейного хранения можно считать элементарной формой учета объема культуры. Но не все можно уместить в национальных библиотеках. Поэтому свои хранилища есть в региональных, специальных и других библиотеках, имеющих в своих фондах более узкоспециализированную информацию (касающуюся, например, истории определенного региона) или материалы определенной тематики (библиотеки с нотными изданиями, патентами, государственными стандартами и т.д.).

В развитии науки особую роль играют академические библиотеки. К традиционным функциям, которые они выполняют, относят организацию и хранение информации, анализ информационных потребностей ученых и мирового информационного рынка с последующим приобретением необходимых научных ресурсов, формирование и доведение до ученых вторичной информации, предоставление первоисточников. С развитием и расширением информационного пространства у ученых появляется бóльший запрос на использование электронных ресурсов, но и здесь библиотеки оказывают значительную поддержку своим читателям. Так, академические библиотеки организуют пользователям доступ к сетевым информационным ресурсам. Многие библиотеки имеют подписку на сервисы, предоставляющие доступ к платным статьям. С появлением новых технологий некоторые ученые могут испытывать трудности при работе. В таком случае сотрудники библиотек могут оказать помощь посетителям в использовании сетевых ресурсов. И эта функция у библиотек не новая, ведь библиотекари и ранее обучали своих посетителей работе с каталогами, сейчас она лишь расширилась. Так, несмотря на появление большего спроса на электронные ресурсы, библиотеки остаются помощниками ученых в доступе к знаниям и в их расширении.

Афиша акции «Библионочь» из Телеграм-канала министра культуры Ольги Любимовой

 

Библионочь

В Общероссийский день библиотек ежегодно проходит всероссийская акция «Библионочь», открывающая читателям двери для посещения различных экскурсий, выставок, показов фильмов и других мероприятий. Главной темой этого года станет любовь к книге. Именно поэтому акция стартует под слоганом «Читаем вместе».

В «Библионочь» участникам акции расскажут о том, как сегодня библиотека становится проводником в информационном потоке, гарантом качества получаемых данных, местом встреч, дискуссий и самореализации. Главным национальным мероприятием акции станет литературный марафон чтений, посвященный творчеству великого русского драматурга А.Н. Островского в год его 200-летия.

Многие библиотеки страны в «Библионочь» придумывают свою уникальную программу. Так, библиотеки Санкт-Петербурга уделят внимание 320-летию со дня основания города, который также отмечают 27 мая. С программами интересующих библиотек можно ознакомиться на их официальных сайтах, а также на сайте акции.

Поздравляем дорогих читателей нашего портала с Общероссийским днем библиотек!

Фото на странице материала: 123rf.

Иллюстрация на главной странице: Российская национальная библиотека, Санкт-Петербург. Фото: A.Savin / Википедия

Автор Анастасия Ибрагимова

библиотеки день библиотек библионочь

Источник: nlr.ru, ru.wikipedia.org, biblionight.culture.ru, cyberleninka.ru, cyberleninka.ru

Информация предоставлена Информационным агентством «Научная Россия». Свидетельство о регистрации СМИ: ИА № ФС77-62580, выдано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций 31 июля 2015 года.

НАУКА ДЕТЯМ

Молодые химики СПбГУ научились находить антибиотики в креветках и сточных водах

19:00 / Химия

Третий форум Федерации ректоров российских и арабских университетов состоится в ОАЭ

18:53 / Наука и общество

Лунный метеорит поступил в коллекцию Музея землеведения

17:50 / Астрономия

Профессор Михаил Гусман: «Здесь собираются выдающиеся умы»

16:30 / Наука и общество

Новое крепление для смартфона позволяет измерять артериальное давление на кончиках пальцев

16:00 / Медицина, Новые технологии

Ученые разработали газовый сенсор для ранней диагностики рака легких

16:00 / Медицина, Химия

Российские ученые получили способ «зеленой» экстракции антиоксидантов из бурых водорослей

15:55 / Биология

В преддверии 180-летия со дня рождения К. А. Тимирязева школьники посетят сельскохозяйственные предприятия и научные лаборатории

15:48 / Биология, Наука и общество

Официальный представитель МИД России Мария Захарова: «Мы должны противодействовать идеологии разрушения»

15:30 / Наука и общество

Исследователи ИХС РАН научились регулировать биологическую активность «наноглин»

13:30 / Химия

«Сергей Петрович Капица был голосом науки для миллионов людей». Академик К.В. Анохин о программе «Очевидное — невероятное»

24.02.2023

«Его передача до сих пор остается непревзойденным стандартом». Академик Валерий Тишков к юбилею «Очевидного — невероятного»

24.02.2023

«Подобно комете на усыпанном звездами небе». Академик А.Л. Асеев о программе «Очевидное — невероятное»

24.02.2023

Татьяна Черниговская: «Нам всем повезло, что мы знали Сергея Петровича Капицу как просветителя»

24.02.2023

Ректор РосНОУ Владимир Зернов: «Очевидное — невероятное» — это квинтэссенция человеческого интеллекта

24. 02.2023

Леопольд Лобковский: «Сергей Капица — человек самого высокого уровня, с которым было просто общаться»

24.02.2023

Смотреть все

Российский суд оштрафовал владельца Википедии за статью о вторжении в Украину

Страница Википедии на iPad, сфотографировано в октябре 2017 г.

Си-Эн-Эн —

Московский суд оштрафовал Фонд Викимедиа за отказ удалить статью из русскоязычной Википедии под названием «Российская оккупация Запорожской области», сообщают государственные СМИ.

Фонд, которому принадлежит Wikipedia, сайт со страницами примерно на 300 языках, включая русский, был оштрафован на 2 миллиона рублей (24 500 долларов США), сообщило в четверг российское государственное информационное агентство ТАСС.

В документах суда утверждается, что Wikimedia отказалась удалить «материал» о боевых действиях «в рамках специальной военной операции» на Украине и о присоединении Запорожской области страны к России, сообщает ТАСС.

Лейанна Микстер, старший юридический менеджер Wikimedia, подтвердила штраф CNN и сказала, что за последние месяцы фонд получил «постоянный поток распоряжений об удалении контента из надежных источников в проектах Wikipedia и Wikimedia».

«Спорная информация в Википедии по-прежнему поступает из надежных источников и соответствует применимым правилам Википедии», — добавила она.

Wikimedia также была оштрафована в России на прошлой неделе и в феврале, сообщает ТАСС.

В России ведутся дебаты о запрете Википедии. Отвечая на вопрос о возможности закрытия веб-сайта в стране, Кремль на прошлой неделе заявил, что сначала необходимо разработать российскую альтернативу.

Россия нуждается в собственном эквиваленте онлайн-энциклопедии из-за опасений Кремля по поводу «неточностей, искажений» и «исторических и фактических ошибок» в Википедии, заявил пресс-секретарь Кремля Дмитрий Песков.

Скучающая китаянка-домохозяйка годами фальсифицировала российскую историю в Википедии

Выдавая себя за ученого, китаянка потратила годы на написание альтернативных описаний средневековой русской истории в китайской Википедии, придумывая воображаемые государства, сражения и аристократов в одном из крупнейших розыгрышей на платформа с открытым исходным кодом.

Мошенничество было разоблачено в прошлом месяце китайским писателем Ифанем, который искал книгу, когда наткнулся на статью о Кашинском серебряном руднике.

Обнаруженный русскими крестьянами в 1344 году, говорится в статье в Википедии, рудник задействовал более 40 000 рабов и вольноотпущенников, обеспечивая замечательный источник богатства для русского княжества Твери в 14-м и 15-м веках, а также последующих режимов. Геологический состав почвы, структура шахты и даже процесс переработки были подробно описаны в записи.

Реклама

Новости

Огромная полицейская база данных предположительно 1 миллиарда граждан Китая продается онлайн Ифань подумал, что нашел интересный материал для романа.

Он и не подозревал, что наткнулся на целый вымышленный мир, созданный пользователем, известным как Жемао. Это была одна из 206 статей, которые она написала в китайской Википедии с 2019 года, вплетая факты в вымысел по сложной схеме, которая годами оставалась незамеченной и проверяла пределы способности краудсорсинговых платформ проверять информацию и отбиваться от злоумышленников.

«Контент, который она написала, имеет высокое качество, а записи были взаимосвязаны, создавая систему, которая может существовать сама по себе», — сказал VICE World News ветеран китайской Википедии Джон Йип. «Чжэмао в одиночку изобрел новый способ подорвать Википедию».

Ифань узнал об этом, когда рассказал историю о серебряном руднике от русскоязычных и проверил факты отсылок Жемао, но обнаружил, что страниц или версий книг, которые она цитировала, не существует. Люди, с которыми он консультировался, также называли ее длинные записи о древних конфликтах между славянскими государствами, которых нельзя было найти в русских исторических записях. «Они были настолько богаты деталями, что посрамили английскую и русскую Википедию», — написал Ифань на Zhihu, китайском сайте, похожем на Quora, где он поделился своим открытием в прошлом месяце и вызвал ажиотаж.

Масштабы мошенничества стали известны после того, как группа редакторов-добровольцев и других участников Википедии, таких как Ип, прочесала ее прошлые материалы почти для 300 статей.

Реклама

СКРИНШОТ ЗАПИСИ ЧЖЕМАО, КОТОРАЯ БЫЛА УДАЛЕНА ИЗ ВИКИПЕДИИ

Одна из ее самых длинных статей по длине почти равнялась «Великому Гэтсби». С формальным, авторитетным тоном энциклопедии он подробно описал три татарских восстания в 17 веке, которые оказали неизгладимое влияние на Россию, вместе с составленной ею картой. В другой записи она поделилась редкими изображениями древних монет, которые, как она утверждает, получила от российской археологической группы.

Одна статья, которую она сильно подделала, была о депортации китайцев в Советский Союз в 1920-х и 30-х годах. Она была настолько хорошо написана, что была выбрана в качестве избранной статьи и переведена на другие языки, включая английский, арабский и русский, что нанесло ущерб другим языковым изданиям Википедии.

Среди первых пользователей, взаимодействовавших с ней, Ип почти не мог поверить, когда узнал, как она обманула систему. Как и многие другие, он ранее был впечатлен знаниями Чжэмао по малоизвестной теме и ее самоотверженностью, поскольку она вносила правки почти через день.

«Ее записи выглядели исчерпывающими, с правильными ссылками, но некоторые были выдуманы, а у других номера страниц не совпадали», — сказал Йип. Например, она часто цитировала «Историю России с древнейших времен», колоссальный 29-томный труд известного российского историка Сергея М. Соловьева. Но китайский перевод, который она цитировала, оказался фальшивым.

Редакторы обычно предполагают, что авторы работают добросовестно, сказал Йе Ючиа, редактор-добровольец, который играет роли патрульного и спасателя и помог сдержать последствия.

Реклама

Новости

Он десятилетиями добивался демократии в Китае. Теперь его обвиняют в шпионаже в пользу Китая.

Rachel Cheung

«При изучении нового контента мы проверяем только, является ли он вопиющим плагиатом и имеет ли он надлежащие источники. Она очень хорошо понимала формат Википедии и предоставила источники, которые было очень трудно проверить», — сказал Йе.

Содержание — это только один аспект ее изобретения.

Чтобы создать впечатление доверия, Чжэмао назвала себя дочерью китайского дипломата, работающего в России, вышедшей замуж за россиянина, и указала в своем профиле свои академические знания, в том числе докторскую степень по всемирной истории Московского государственного университета. Недавно она добавила, что является пацифисткой, и приложила петицию, которую ее муж якобы подписал в знак протеста против вторжения России в Украину.

Хотя Чжэмао время от времени притворялась смиренной и выражала отвращение к «онлайн-марионеткам», расследование также показало, что она контролировала как минимум четырех носочных марионеток, альтернативные аккаунты, которые она использовала для создания иллюзии поддержки. «Пожалуйста, не называйте меня боссом, я всего лишь обычная ученица», — написал Жемао в ответ одному из них.

С другой марионеткой из носка она выдавала себя за аспирантку всемирной истории Пекинского университета, которая училась в России, и утверждала, что знает Чжэмао в реальной жизни. Хотя одна учетная запись, Inquisitive Amateur, была активна с 2010 года, расследование показало, что она получила контроль над ней только в 2019 году.

«Я думал, что у нее редкий талант, поскольку на сайте не хватало писателей, хорошо разбирающихся в средневековой России», — сказал VICE World News Эрик Лю, студент-историк, работающий с Википедией с 2015 года. Ранее в этом году он наградил ее звездой Википедии в знак благодарности за ее вклад.

«Я глубоко сожалею, что не понял ее глупостей и даже не поддержал ее. Такое ощущение, что я был сообщником ее схемы», — сказал Лю. Инцидент нанес тяжелый удар по снижающемуся доверию к сайту, и теперь многие пользователи параноидально относятся к потенциальному мошенничеству, добавил он.

Новости

Китайские женщины смотрят на Эйлин Гу и не видят себя

Виола Чжоу

В качестве наказания Zhemao и связанные с ней учетные записи были заблокированы навсегда. Большинство ее статей были удалены на основе консенсуса сообщества. Некоторые википедисты даже обращались к экспертам с просьбой помочь отделить зерна от плевел.

«Добровольцы продолжают просматривать дополнительные статьи, которые могли быть затронуты», — сообщил VICE World News по электронной почте представитель Фонда Викимедиа.

«Вандализм или другое негативное поведение время от времени может происходить в Википедии, как и ожидается от любой открытой онлайн-платформы, в которой каждый может внести свой вклад. При этом такой специфический тип поведения в Википедии не является обычным явлением», — добавили они.

Так кто же такой Жемао в реальной жизни? Она призналась в письме с извинениями, опубликованном в ее аккаунте в Википедии в прошлом месяце. Она не говорит ни по-английски, ни по-русски и является домохозяйкой со средним образованием.

Реклама

Обман начался с безобидного намерения. Не имея возможности понимать научные статьи на языке оригинала, она собирала предложения по кусочкам с помощью инструмента для перевода и заполняла пробелы собственным воображением. «Как говорится, чтобы защитить ложь, нужно больше лгать», — написала она. Вскоре они накопились в десятки тысяч символов, которые она не хотела удалять.

Новости

Китайский производитель дронов DJI прекращает продажи в России и Украине

Алан Вонг

Альтернативные учетные записи были воображаемыми друзьями, которых она «косплеила», так как ей было скучно и одиноко, учитывая, что ее муж большую часть времени отсутствовал, а у нее не было друзей. Она также извинилась перед настоящими экспертами по России, с которыми пыталась заигрывать, а затем выдавала себя за них.

Ваш комментарий будет первым

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *