Es En Ru

Rein-IT

Создал это изображение по придуманному мною запросу в сервисе ИИ

e-mail: denis@rein.cr

Только WhatsApp

Telegram: @rein_den

Linkedin: Rein



Способы поиска информации, методы и подходы. OSINT

Ранее, примерно 10-15 лет назад, основная цель университетов заключалась не в обучении студентов конкретным навыкам, поскольку подходы и методы работы постоянно менялись. Вместо этого, университеты стремились обучить студентов навыкам обработки и поиска информации среди огромного объема доступных данных. В настоящее время этот подход по-прежнему актуален, однако объем информации значительно возрос и стал проблемой.

Ниже я расскажу о своих подходах к поиску информации.

Google:

  • В большинстве случаев Google выполняет поиск на том языке, на котором был задан запрос.
  • Google учитывает вашу историю запросов и сортирует результаты по предполагаемой для вас значимости. Используйте режим инкогнито, чтобы получать более объективные результаты.
  • Google учитывает ваше местоположение по IP-адресу. Если нужно обойти ограничения по местоположению, используйте прокси-сервер.
  • Вместо вопроса к поисковой системе, попробуйте ввести часть предполагаемого ответа.
  • Google умеет склонять слова и использовать различные формы глаголов. Вам не нужно вручную изменять запрос для этого.
  • Регистр букв в запросе не имеет значения, его можно вводить в верхнем или нижнем регистре.

Google рассматривает пробелы между словами как логическое "И", что означает, что вы получите результаты по каждому слову из запроса. Чтобы сузить поиск, заключайте фразы, которые хотите найти целиком, в кавычки. Вы также можете заменить неизвестные слова символом звездочки (*).

Далее рассмотрим подробнее:

Google Dorks:

  1. Комбинируйте Google Dorks для более точных запросов.
  2. Библиотека Google Dorks для изучения: [Ссылка на библиотеку] [Подборка на GitHub]
  3. Google индексирует следующие типы файлов: [Ссылка на типы файлов].


Пример использования популярных Google Dorks для поиска информации.

Предположим, нам нужно собрать адреса электронной почты или найти информацию о поставщиках для университетов в Коста Рике, которые обычно используют доменное имя ac.cr. Для поиска на всех таких доменах можно использовать следующий запрос:

site:*.ac.cr

Мы также знаем, что структурированная информация часто хранится в таблицах, поэтому мы можем добавить тип файла "XLSX" и ключевые слова "e-mail", "email" и "correo electrónico" (испанский для "электронной почты"), а также "nombre proveedor" (испанский для "имя поставщика").

В результате получим следующий запрос:

site:*.ac.cr filetype:xlsx email e-mail "correo electrónico" "nombre proveedor"


Если мы хотим найти актуальную персональную информацию за текущий год, можно использовать запрос вроде:

site:*.ac.cr filetype:xlsx Cédula 2023

 

Если какие-то ссылки не открываются, можно нажать на три точки рядом с результатом поиска и выбрать "Просмотреть копию" из сохраненной истории сканирования Google.

Чтобы исключить некоторые запросы из результатов поиска, можно добавить знак минус перед запросом или перед доменным именем низкого уровня.

Напримерsite:.ac.cr filetype:xlsx Cédula -Formulario -Hoja1 -ucr.ac.cr

 

Вы также можете ограничить результаты по годам,

напримерsite:.ac.cr filetype:xlsx Cédula "2022..2023" -Formulario -Hoja1 -ucr.ac.cr

Кроме того, Вы можете использовать специализированные поисковые системы, например:

  • [ссылка на intelx.io]: упрощает написание поисковых запросов и предлагает собственный архив данных. При платной подписке доступен поиск по darknet.
  • [ссылка на dedigger.com]: поиск файлов и документов на Google Drive. Поиск осуществляется для ресурсов, размещенных в публичном доступе.

Часто бывает, что мы находим множество документов, которые имеют различные форматы, включая сканы и фотографии, и количество данных настолько велико, что обычный поиск по тексту (CTRL+F) не дает результатов и приводит к отвлечению.

В таких случаях рекомендуется использовать сервис от Google:

[ссылка на journaliststudio] 

 

Чтобы начать, создайте рабочую область, добавьте все необходимые документы и дождитесь их загрузки и обработки. В этом сервисе:

  • Большие файлы разбиваются на более мелкие части.
  • Изображения текста преобразуются в текст.
  • Аудиофайлы также преобразуются в текст.
  • Видеофайлы также преобразуются в текст.

Система умеет искать синонимы, расшифровывать аббревиатуры, и главное, поиск ведется по всем загруженным документам. Вы можете перейти к конкретному документу и производить поиск только в нем. Можно копировать, выделять необходимую информацию цветом и создавать ссылки на конкретные документы.

Для анализа частотности слов, оценки степени спама и других статистических данных по тексту вы можете использовать следующие онлайн-инструменты: