Главная / Интернет-разведка / Возможности и ограничения автоматического выявления негатива и позитива. Ющук Евгений Леонидович.

Возможности и ограничения автоматического выявления негатива и позитива. Ющук Евгений Леонидович.

Вокруг вопросов автоматизации выявления негатива и позитива в текстах при современном уровне развития систем мониторинга споры возникают часто. У критиков таких систем есть два основных аргумента. Первый - что автомат не может различить сарказм и юмор, а второй - что если в тексте есть два объекта (например, при сравнении типа "Мерседес" - гуано, и это известно каждому нормальному человеку, а вот "Лада Калина" - рулёззз") - автомат не поймет, к кому что относится.

Выскажу свое мнение по этому вопросу.

Автоматы действительно во многом уступают человеку, когда речь идет о понимании эмоций. Но они значительно превосходят человека в скорости работы. Поэтому, для практических целей бывает значительно важнее сделать охват в миллион страниц, нежели тщательно проанализировать десяток. И это, на практике, не приводит к проблемам, при современном развитии систем определения позитива и негатива. Поясню, почему.

Во-первых, далеко не всегда даже один человек может понять другого. Да хоть на любой Интернет-форум посмотрите - время от времени приходится переспрашивать, что имел в виду человек. В этом плане, машинное выявление негатива и позитива не лучше и не хуже человеческого.

Во-вторых, интернет-ресурсы, которые оцениваются с точки зрения негатива и позитива, делятся на две неодинаковых по размеру категории. Первые - это значимые, широко посещаемые, авторитетные ресурсы. Их не много.
Вторые - "массовка". В "массовке" мнение каждого отдельного человека значения не имеет, но важно именно количество. Когда оно небольшое- это никак не влияет на ситуацию, когда оно становится большим - влияет.

Исходя из этого, очевиден и вывод: значимые ресурсы машина может отсматривать только на предмет факта упоминания объекта, но не оценки негатива и позитива. Такую оценку производит уже человек.
"Массовку" машина может отсматривать и на предмет оценки негатива и позитива.

Как при этом избегать проблемы сарказма/юмора и проблемы, что негативное слово относится к другому объекту, который также упомянут в тексте?

На самом деле, нет тут никакой проблемы, с практической точки зрения.
Сарказм встречается в рафинированном виде настолько редко, по сравнению с более прямыми высказываниями, что в случае "массовки" его можно спокойно проигнорировать. Он, скорее всего, даже уравновесится обратными высказываниями, также не отлавливаемыми машиной, в результате удельный вес негатива и позитива значимым образом не изменится. Но и эта флюктуация настолько незначительна, что значения не имеет.
Негатив/позитив, относящийся к объекту изучения, отлавливается (например, в IQBuzz) за счет параметра "расстояние от объекта". Т.е., например, смотрим негатив только в пяти словах от объекта. Естественно, часть объектов не попадет в выборку. Ну и что? Вы когда масштабы паводка на Дальнем Востоке оцениваете, чтобы понять, прибывает вода или отступает, пытаетесь с точностью до стакана его измерять? Это важно?



Вот и в случае с системами определения динамики негатива и позитива - точно так же.

 

Разместить Вконтакте Разместить в Твиттере Разместить в Фейсбуке Разместить в Живом Журнале
Вернуться к списку

Еще в этом разделе:

«Аська-предатель». Роль ICQ в конкурентной разведке. Ющук Евгений Леонидович.

Как искать в Google. Ющук Евгений Леонидович.

Корпоративный блог: взгляд на «теневую сторону Луны». Евгений Ющук, Александр Кузин.

Боевой блогинг - инструмент конкурентной разведки.Ющук Евгений Леонидович.

Логика сетевого сыска. Кейс по поиску информации в Интернете. Ющук Евгений Леонидович.

Кейс. Как различать фейки. На примере "Кремль поздравил Собянина с победой на выборах"

Кейс. Восстановление быстро стертой информации, почти исчезнувшей из кэша поисковиков.

Кейс. Деанонимизация агрессивного человека, долгое время пытавшегося сохранить анонимность. Ющук Евгений Леонидович

Кейс. *Интернет большой - меня не найдут* и *Да кому я нафиг нужен?* - заблуждения.

Кейс. Прикладная задача: поиск в домене. На примере российских общественных организаций. Ющук Евгений Леонидович.

Кейс от Андрея Масаловича. Сколько денег на счете у депутата и где они лежат?

Кейс. Активные мероприятия в Интернете. Опыт полиции.

Кейс. Мониторинг Твиттера на службе Судебных приставов. Ющук Евгений Леонидович.

Кейс. Иллюзия анонимности в Интернете. На примере акции с мигалками.

База данных по оффшорам

Поиск по изображениям: выигрыш конкурса за пару минут, или без кружки специалист КР не останется. Евгений Ющук.

Кейс. Как шел в Интернете разгон темы «о грядущей деноминации».

Кейс по конкурентной разведке. Андрей Масалович. Запчасти к вертолетам в открытых источниках.

Судью отстранили от должности - фотки Вконтакте сказались. А YouTube «сдал» таможенников.

Апачи в Конкурентной разведке. Отличное объяснение от Lukamud

Кейс. Web ThumbnailExpert в работе Конкурентной разведки. Евгений Ющук.

Кейс. Операторы Яндекса и Гугла на службе Конкурентной разведки. Ющук Евгений Леонидович.

NameChk.com - Инструмент для поиска ника в социальных сетях. Ющук Евгений Леонидович.

Кейс. Прикладная задача: поиск в домене. На примере российских общественных организаций. Евгений Ющук.

Облако слов как инструмент первичной оценки сайта (и позиции его автора). Евгений Ющук.

Кейс от Андрея Масаловича. Сколько и где денег у депутата?

Yatedo.com - Поисковик по людям. В т.ч. - работающим в конкретной компании. Евгений Ющук.

Кейс. Восстановление быстро стертой информации, почти исчезнувшей из кэша поисковиков. Ющук Евгений Леонидович.

«Их знали только в лицо». Елена Ларина.

Зарисовка на тему вбросов, попадающих в ожидания публики. Ющук Евгений Леонидович.

«Визуалка», фактура и смыслы в современном информационном противоборстве. Ющук Евгений Леонидович.

Открытые данные органов исполнительной власти РФ. Ющук Евгений Леонидович

Центр Виктора Воксанаева: Американский доклад «ATP 2-22.9» о разведке по открытым источникам

Кейс. Разоблачение фейка в информационной войне. На примере Евромайдана.

Кейс. Информационная война против Олимпиады. «Фокус и разоблачение фокуса».

Кейс. Компрометация ботнета в Фейсбуке. Ющук Евгений Леонидович.

Кейс. Геометки. Как Псаки и СБУ могут дурить весь мир в несколько кликов.

Кейс. Пытаемся разоблачить фейк с вконтактиком российского солдата, стреляющего по Украине из гаубиц

Основы информационной войны. Свою точку зрения надо отстаивать всегда. Совсем всегда. Вообще всегда.

Кейс. Оценивайте информацию по дате, источнику, изменениям во времени.

"О практике применения судами Закона Российской Федерации "О средствах массовой информации".

Кейс. Александр Бречалов: проясняем «белые пятна» в биографии Бречалова Александра Владимировича

Почему Евгений Артюх достоин звания политической проститутки? Показываю. По его личной просьбе

Выявление систем зарубежных компаний

Место частных детективов в аналитике

Информационная война в социальных сетях

Кейс. Как быстро оценить изменения позиии источника

Россотрудничество, МИД, Правый сектор, Швейцария, Координационный совет, Кейс

Расследование: Концерт с активистами Правого сектора довел Россотрудничество до Генпрокуратуры

Кейс. Прерываем коммуникации украинских террористических организаций. Шаг второй.

Публицистика Евгения Ющука

ПРИМЕРЫ РАССЛЕДОВАНИЙ ПО ОТКРЫТЫМ ИСТОЧНИКАМ, КОТОРЫЕ ВЫПОЛНИЛ ЕВГЕНИЙ ЮЩУК

Как проверить подлинность видео в Интернете

Вернуться к списку

Корпоративные курсы Евгения Ющука по Конкурентной разведке. Адаптируются под потребности заказчика. Много практики. Решение конкретных задач предприятия.
«Дезинформация и активные мероприятия в бизнесе» - книга уже в продаже!
«Конкурентная разведка: маркетинг рисков и возможностей» - второе издание уже в продаже!

Мои сайты

Ci-razvedka.ru

Razvedka-internet.ru

Yushchuk.livejournal.com

Фейсбук Евгения Ющука

 

ПРИМЕРЫ РАССЛЕДОВАНИЙ ЕВГЕНИЯ ЮЩУКА ПО ОТКРЫТЫМ ИСТОЧНИКАМ

 

* "Правый сектор" - организация, запрещенная в России по решению Верховного суда

Еще примеры расследований Евгения Ющука, выполненных по открытым источникам, можно посмотреть здесь.