Яндекс.Дзен очень не любит шокирующий контент

Очередное предупреждение от Яндекс.Дзен. В этот раз алгоритм нашел «шокирующий контент»

27.08.2021 Марина 4 минут чтение

2 147

То ли алгоритм Дзена потихоньку сходит с ума, то ли еще что, но, право слово, у меня уже руки опускаются: захожу в свой кабинет на платформе Яндекс.Дзен и что вижу? — новое предупреждение! Второе по счету! И снова — на старую публикацию! Единственное разнообразие — в этот раз система вынесла предупреждение не о «ненормативной лексике», а о «шокирующем контенте». И обнаружила она его в статье «Собаки-капризульки, привередины в еде. И как с этим бороться», которая была опубликована аж 27 января 2020 года — более, чем полтора года назад (!).

Таким образом, стало у меня на канале два предупреждения.

Я честно перечитала собственную статью, пытаясь найти в ней «шокирующий контент». Не нашла. Обратилась к Яндекс.Справке — вдруг требования изменились, а я об этом и не знаю. Но, нет — все осталось неизменным, как и раньше, — цитирую:

«Шокирующий контент
Это описание или изображение:
— жертв катастроф и насильственных действий (людей и животных);
— травм, болезней, уродств, трупов;
— детализированного процесса родов;
насекомых и животных, чей вид вызывает отвращение.
В Дзене запрещено размещать такой контент, даже если он уместен в рамках вашего канала. Мы не хотим, чтобы публикации Дзена пугали или шокировали пользователей. Каналы с шок-контентом блокируются без возможности восстановления» (цитата из Яндекс.Справки).

Ну, и скриншот в подтверждение:

Требования к контенту на Яндекс.Дзен — Скриншот со страницы Яндекс.Справки

Снова обратилась к собственной статье. Задумалась. На что среагировал алгоритм, почему счел, что в публикации присутствует шокирующий контент, когда его нет? — ведь ничего из вышеперечисленного я в статье не описывала. Решила разобрать статью «под микроскопом» — надо же понять, в чем причина такого вердикта, ведь на что-то алгоритм да ориентировался, не с бухты-барахты же вынес предупреждение. И нашла в итоге в тексте «страшные» слова (!).

Какие слова «не любит» Яндекс.Дзен

«Страшных» слов в тексте оказалось более десятка. Ориентируясь на них, алгоритм Дзена вполне мог счесть, что речь идет не о детских игрушках, а, как минимум, о болезни. Вот эти слова:

голодная
мучений
бедный
диагноз
покраснело
аллергическая
аллергия
умерла
тяжело
лечение
аллергологу
борьба
голодовки
худеет
толстеет

А теперь скажите, если бы вам показали только эти слова и сказали, что они все идут в одном тексте, а потом спросили, — «Как вы думаете, о чем этот текст?» — чтобы вы решили? — я бы точно решила, что речь идет о какой-то страшной болезни, с аллергическими реакциями, которую побороть не удалось, так как кто-то там все-таки умер. Вот и алгоритм Яндекс.Дзена «мыслит» подобным образом: видит «страшные» слова (возможно, при этом высчитывает их процент на весь текст — это я не знаю) и выносит вердикт, что контент — «шокирующий». И оно не удивительно, ведь искусственный интеллект понимать слова в контексте не умеет. У него либо «да», либо «нет», либо 0, либо 1, либо черное, либо белое — по другому он не умеет.

Вот так вот и появилось у меня на канале второе предупреждение, вынесенное системой Дзена.

Скриншот. Специально привожу его целиком, чтобы было видно, что предупреждений два

Ограничение, наложенное на статью, в итоге сняли

Но алгоритм тут ни при чем, естественно, это не он «передумал»: техподдержка после моего обращения перепроверила текст (хорошо, что я в свое время не редактировала его — я этого, естественно, не помню, но раз техподдержка перепроверила, значит текст после публикации не менялся) и изменила вердикт: «…После повторной проверки вердикт был изменен. Ваша публикация теперь рекомендуется всем заинтересованным пользователям».

После повторной проверки вердикт алгоритма о шокирующем контенте был снят техподдержкой Яндекс.Дзена

Лично меня радуют три момента:

первое — что ограничение все-таки сняли, как-то «накапливать» их мне совсем не хочется;
второе — что ограничение было наложено на старую публикацию, то есть на количестве показов это никак не сказалось, поскольку её и так в ленте уже не крутят;
третье — что человеческая проверка/перепроверка все-таки возможна. Пусть при определенных условиях — но возможна.

Статья, о которой здесь идет речь, была написана мной более года назад. Сейчас «страшные» слова я не использую — как-то уже разбиралась с техподдержкой по поводу ограничения одной публикации, ограничение было наложено ошибочно, но мне этого хватило: пишу, находя альтернативные варианты «страшным» словам. Уж очень мне не нравится коверкать язык, пытаясь обмануть алгоритм, и писать «sука», «kоbель» или еще как-то, чтобы искусственный интеллект не догадался, что это за слова. Да, слова «сука» и «кобель» алгоритм тоже не любит, тут же выносит предупреждение об использовании ненормативной лексики и ограничивает статью в показах.

Русский язык настолько богат и многообразен, что позволяет писать любой текст, не нарушая требований платформы Яндекс.Дзен к контенту.

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!