Введение в информационный поиск

  • 0.0
Approx. 33 hours to complete

Course Summary

This course provides an introduction to information retrieval, covering topics such as retrieval models, indexing, and evaluation of search engines.

Key Learning Points

  • Learn about the different retrieval models used in information retrieval
  • Understand the process of indexing and how it affects search engine results
  • Gain knowledge on how to evaluate the effectiveness of search engines

Job Positions & Salaries of people who have taken this course might have

    • USA: 90000
    • USA: USD
    • India: 1200000
    • India: INR
    • Spain: 38000
    • Spain: EUR
    • USA: 90000
    • USA: USD
    • India: 1200000
    • India: INR
    • Spain: 38000
    • Spain: EUR

    • USA: 110000
    • USA: USD
    • India: 1800000
    • India: INR
    • Spain: 45000
    • Spain: EUR
    • USA: 90000
    • USA: USD
    • India: 1200000
    • India: INR
    • Spain: 38000
    • Spain: EUR

    • USA: 110000
    • USA: USD
    • India: 1800000
    • India: INR
    • Spain: 45000
    • Spain: EUR

    • USA: 55000
    • USA: USD
    • India: 800000
    • India: INR
    • Spain: 26000
    • Spain: EUR

Related Topics for further study


Learning Outcomes

  • Understand the basic concepts of information retrieval
  • Learn about the different retrieval models and their applicability
  • Gain knowledge on how to evaluate the effectiveness of search engines

Prerequisites or good to have knowledge before taking this course

  • Basic understanding of programming concepts
  • Familiarity with data structures and algorithms

Course Difficulty Level

Intermediate

Course Format

  • Online
  • Self-paced

Similar Courses

  • Applied Data Science: Machine Learning
  • Introduction to Data Science in Python

Related Education Paths


Notable People in This Field

  • Stephen Robertson
  • Karen Spärck Jones

Related Books

Description

Данный курс был создан сотрудниками "Mail.Ru Group". При разработке заданий упор делался на знания и опыт, которые используются сотрудниками на практике ежедневно при проектировании продуктов, которыми пользуются миллионы людей.

Outline

  • Введение, булев поиск
  • Приветствие
  • МФТИ
  • История поисковых систем
  • Базовые понятия
  • Классификация поисковых систем
  • Основы булева поиска. Логические операции
  • Матрица инцидентности и переход к обратному индексу
  • Обработка запросов с обратным индексом
  • Зачем нужна нормализация
  • Определение языка
  • Стемминг
  • Лемматизация текста
  • Фразовые запросы
  • Координатный индекс
  • Mail.Ru Group
  • Решение
  • Базовые понятия информационного поиска
  • Булев поиск и матрица инцидентности
  • Нормализация текста. Стемминг. Лемматизация
  • Фразовые запросы. Координатный индекс
  • Поисковый индекс
  • Обратный индекс
  • Построение индекса на реальной коллекции документов
  • Блочное индексирование. Распределенное индексирование
  • Инкрементальная индексация
  • Параметрические индексы и зонные индексы
  • Сокращение индекса, стоп-слова
  • Сжатие словаря
  • Сжатие инвертированного файла
  • Skip-листы
  • Решение
  • Обратный индекс, индексация
  • Сжатие индекса
  • Нечёткий поиск
  • Структуры для словарей. Хеш-таблицы
  • Структуры для словарей. Деревья
  • Нечёткий поиск
  • Перестановочный индекс
  • K-граммный индекс
  • Расстояние редактирования
  • Динамический алгоритм нахождения расстояние между словами
  • Фонетические исправления
  • Исправления в контексте
  • Решение
  • Структуры данных
  • Нечеткий поиск
  • Исправление ошибок
  • Ранжирование
  • Введение
  • Текстовое ранжирование
  • Модель мешка слов
  • Представление документов в виде векторов. Расстояние между документами
  • Tf-Idf
  • Принцип вероятностного ранжирования
  • Бинарная модель независимости
  • Переход от BIM к BM25
  • Решение
  • Текстовое ранжирование
  • Вероятностная модель ранжирования
  • Ссылочное и поведенческое ранжирование
  • Основы ссылочного ранжирования
  • Алгоритм PageRank
  • Итеративный подход для вычисления PageRank
  • Вычисления PageRank с помощью марковских цепей
  • Алгоритм HITS
  • Разновидности PageRank: тематический, персонализированный
  • Позиционный базис
  • Каскадные поведенческие модели
  • Join Relevance Examination Model (JRE)
  • Релевантность и привлекательность
  • ClickRank и BrowseRank
  • Решение
  • Ссылочное ранжирование
  • Поведенческое ранжирование
  • Оценка качества
  • Качество поиска
  • Методы оценки качества
  • Оффлайн-метрики
  • Асессоры и асессорская оценка
  • DCG
  • A/B тестирование
  • Interleaving
  • Team-Draft Interleaving
  • Оценка поисковых сниппетов
  • Оценка качества поиска
  • Оценка качества поиска

Summary of User Reviews

Discover the fundamentals of information retrieval with this course on Coursera. Students have given this course high praise for its engaging content and knowledgeable instructors. Many users appreciate the hands-on approach taken in this course, which allows them to practice what they learn along the way.

Key Aspect Users Liked About This Course

The hands-on approach taken in this course, which allows students to practice what they learn along the way.

Pros from User Reviews

  • Engaging content that keeps students interested and motivated
  • Knowledgeable instructors who are able to explain difficult concepts clearly
  • Variety of assignments and quizzes that help students reinforce what they learn
  • Great course for beginners who are new to information retrieval

Cons from User Reviews

  • Some users have reported technical issues with the platform
  • Course may move too quickly for some students
  • Lack of personalized feedback from instructors
Russian
Available now
Approx. 33 hours to complete
Сергукова Юлия Михайловна, Плеханов Михаил Владимирович
Moscow Institute of Physics and Technology, Mail.Ru Group
Coursera
Share
Saved Course list
Cancel
Get Course Update
Computer Courses