Задание
 У вас есть четыре документа:
 a fat cat sat on a mat and ate a fat rat,
 little funny fluffy cat,
 the cat,
 huge green crocodile.
 И есть стоп-слова: “a”, “the”, “on”, “cat”. Приходит запрос: funny fat cat. Найдите все документы, где есть хотя бы одно слово из запроса. Учтите стоп-слова и не включайте их в результаты поиска. Примерный алгоритм:
 Берёте слово из запроса, проверяя, что это не стоп-слово;
 Ищете слово в контейнере;
 Спрашиваете у контейнера, в каких документах это слово встречается. У контейнера уже есть ответ;
 Добавляете индексы документов к результату;
 Повторяете все шаги для каждого из слов в запросе;
 Помещаете все результаты в вектор и отправляете пользователю.
 Упомянутый в алгоритме контейнер — это map. Ключом в map будет слово, а значением — некий контейнер документов, в которых это слово встречается. Важно правильно записывать в словарь элементы в момент добавления документа.
 Запрос funny fat cat должен сработать так:
 Берёте слово “funny”, которое не входит в список стоп-слов;
 Обращаетесь к словарю и находите в нём “funny”;
 В словаре по ключу “funny” уже должен быть записан документ 1;
 Добавляете документ 1 в результирующий вектор;
 Берёте слово “fat”. Оно тоже не входит в список стоп-слов;
 В словаре по ключу “fat” лежит документ 0;
 Добавляете документ к результату;
 “Cat” — стоп-слово, поэтому оно вам не интересно;
 Возвращаете пользователю вектор с двумя элементами: 0 и 1.
 Напишите функции AddDocument и FindDocuments, которые бы реализовывали решение описанной задачи. AddDocument должна заполнять индекс word_to_documents:
 void AddDocument(map >& word_to_documents,
 const set & stop_words,
 int document_id,
 const string& document); 
 Функция FindDocuments должна искать и выдавать требуемые идентификаторы документов в виде вектора:
 vector FindDocuments(const map >& word_to_documents,
 const set & stop_words,
 const string& query); 
 В векторе с результатами не должно быть повторов. Используйте для избегания дубликатов контейнер set как промежуточный. При копировании из set в вектор результатов не меняйте порядок элементов.
 Не меняйте сигнатуру FindDocuments.
 СТРОКА СТОП-СЛОВ ЧИСЛО ДОКУМЕНТОВ ДОКУМЕНТ0 ДОКУМЕНТ1 ДОКУМЕНТ2 ДОКУМЕНТ3 ЗАПРОС
 a the on cat 4 a fat cat sat on a mat and ate a fat rat little funny fluffy cat the cat huge green crocodile funny fat cat
 Вывод (id документов):
 0
 1
                Другие вопросы по: Информатика
Знаешь правильный ответ?
							Задание У вас есть четыре документа: a fat cat sat on a mat and ate a fat rat, little funny fluffy c...
							 
 
Популярные вопросы