Очередное предупреждение от Яндекс.Дзен. В этот раз алгоритм нашел «шокирующий контент»
То ли алгоритм Дзена потихоньку сходит с ума, то ли еще что, но, право слово, у меня уже руки опускаются: захожу в свой кабинет на платформе Яндекс.Дзен и что вижу? — новое предупреждение! Второе по счету! И снова — на старую публикацию! Единственное разнообразие — в этот раз система вынесла предупреждение не о «ненормативной лексике», а о «шокирующем контенте». И обнаружила она его в статье «Собаки-капризульки, привередины в еде. И как с этим бороться», которая была опубликована аж 27 января 2020 года — более, чем полтора года назад (!).
Таким образом, стало у меня на канале два предупреждения.
Я честно перечитала собственную статью, пытаясь найти в ней «шокирующий контент». Не нашла. Обратилась к Яндекс.Справке — вдруг требования изменились, а я об этом и не знаю. Но, нет — все осталось неизменным, как и раньше, — цитирую:
«Шокирующий контент Это описание или изображение: — жертв катастроф и насильственных действий (людей и животных); — травм, болезней, уродств, трупов; — детализированного процесса родов; насекомых и животных, чей вид вызывает отвращение. В Дзене запрещено размещать такой контент, даже если он уместен в рамках вашего канала. Мы не хотим, чтобы публикации Дзена пугали или шокировали пользователей. Каналы с шок-контентом блокируются без возможности восстановления» (цитата из Яндекс.Справки).
Ну, и скриншот в подтверждение:
Снова обратилась к собственной статье. Задумалась. На что среагировал алгоритм, почему счел, что в публикации присутствует шокирующий контент, когда его нет? — ведь ничего из вышеперечисленного я в статье не описывала. Решила разобрать статью «под микроскопом» — надо же понять, в чем причина такого вердикта, ведь на что-то алгоритм да ориентировался, не с бухты-барахты же вынес предупреждение. И нашла в итоге в тексте «страшные» слова (!).
Какие слова «не любит» Яндекс.Дзен
«Страшных» слов в тексте оказалось более десятка. Ориентируясь на них, алгоритм Дзена вполне мог счесть, что речь идет не о детских игрушках, а, как минимум, о болезни. Вот эти слова:
- голодная
- мучений
- бедный
- диагноз
- покраснело
- аллергическая
- аллергия
- умерла
- тяжело
- лечение
- аллергологу
- борьба
- голодовки
- худеет
- толстеет
А теперь скажите, если бы вам показали только эти слова и сказали, что они все идут в одном тексте, а потом спросили, — «Как вы думаете, о чем этот текст?» — чтобы вы решили? — я бы точно решила, что речь идет о какой-то страшной болезни, с аллергическими реакциями, которую побороть не удалось, так как кто-то там все-таки умер. Вот и алгоритм Яндекс.Дзена «мыслит» подобным образом: видит «страшные» слова (возможно, при этом высчитывает их процент на весь текст — это я не знаю) и выносит вердикт, что контент — «шокирующий». И оно не удивительно, ведь искусственный интеллект понимать слова в контексте не умеет. У него либо «да», либо «нет», либо 0, либо 1, либо черное, либо белое — по другому он не умеет.
Вот так вот и появилось у меня на канале второе предупреждение, вынесенное системой Дзена.
Ограничение, наложенное на статью, в итоге сняли
Но алгоритм тут ни при чем, естественно, это не он «передумал»: техподдержка после моего обращения перепроверила текст (хорошо, что я в свое время не редактировала его — я этого, естественно, не помню, но раз техподдержка перепроверила, значит текст после публикации не менялся) и изменила вердикт: «…После повторной проверки вердикт был изменен. Ваша публикация теперь рекомендуется всем заинтересованным пользователям».
Лично меня радуют три момента:
- первое — что ограничение все-таки сняли, как-то «накапливать» их мне совсем не хочется;
- второе — что ограничение было наложено на старую публикацию, то есть на количестве показов это никак не сказалось, поскольку её и так в ленте уже не крутят;
- третье — что человеческая проверка/перепроверка все-таки возможна. Пусть при определенных условиях — но возможна.
Статья, о которой здесь идет речь, была написана мной более года назад. Сейчас «страшные» слова я не использую — как-то уже разбиралась с техподдержкой по поводу ограничения одной публикации, ограничение было наложено ошибочно, но мне этого хватило: пишу, находя альтернативные варианты «страшным» словам. Уж очень мне не нравится коверкать язык, пытаясь обмануть алгоритм, и писать «sука», «kоbель» или еще как-то, чтобы искусственный интеллект не догадался, что это за слова. Да, слова «сука» и «кобель» алгоритм тоже не любит, тут же выносит предупреждение об использовании ненормативной лексики и ограничивает статью в показах.
Русский язык настолько богат и многообразен, что позволяет писать любой текст, не нарушая требований платформы Яндекс.Дзен к контенту.