Сколько слов вы на самом деле знаете? Новый инструмент в Лингвистической лаборатории
Вы можете довольно хорошо чувствовать свой уровень в языке.
Читаете статьи, смотрите сериалы в оригинале, иногда говорите или переписываетесь. Но если задать более конкретный вопрос — сколько слов вы на самом деле знаете? — ответить уже гораздо труднее.
А между тем размер словарного запаса — один из важных ориентиров, когда мы пытаемся понять свой реальный уровень, способность читать без постоянных остановок и в целом степень освоенности языка.
Поэтому я сделал Vocabulary Size Estimator — новый бесплатный инструмент в Лингвистической лаборатории .
Что делает этот инструмент
Вы выбираете язык, и сервис показывает вам короткий список слов из разных частотных диапазонов — от самых употребительных до гораздо более редких. Вы отмечаете те слова, которые знаете, и через несколько минут получаете:
- примерную оценку словарного запаса
- диапазон результата
- примерное соответствие уровню CEFR
- разбивку по частотным диапазонам
Сейчас инструмент работает для английского, немецкого, испанского, французского и русского языков.
Как это устроено
Тест не случайный.
Слова берутся из заранее подготовленных частотных таблиц лемм и распределяются по пяти диапазонам частотности на основе Zipf-оценки — показателя того, насколько слово употребительно в реальном языке.
В каждый диапазон входят не только реальные слова, но и несколько псевдослов — правдоподобно выглядящих, но не существующих слов. Они нужны для того, чтобы выявлять завышение результата. Если человек отмечает слишком много псевдослов как знакомые, оценка помечается как ненадёжная.
Дальше инструмент корректирует результат с учётом доли таких ложных срабатываний и рассчитывает доверительный интервал. Кроме того, размеры диапазонов ограничены реалистичными максимумами, чтобы длинный хвост редких, случайных или маргинальных слов в корпусе не раздувал итоговую оценку.
Иными словами, цель здесь не в том, чтобы выдать красивую цифру, а в том, чтобы получить более правдоподобную.
Зачем я это сделал
Мне хотелось сделать тест на словарный запас, который был бы коротким, понятным и при этом не совсем игрушечным.
Многие подобные тесты в интернете либо слишком поверхностны, либо не очень понятно устроены. Здесь мне хотелось опереться на частотность слов, добавить поправку на переоценку своих знаний и дать на выходе не просто одно число, а немного более содержательный результат.
Разумеется, никакой короткий тест не может идеально измерить словарный запас. Но такой инструмент всё равно может быть полезной точкой отсчёта — особенно если вы хотите лучше понимать свой текущий уровень и реалистичнее оценивать своё чтение и понимание языка.
Попробуйте
Vocabulary Size Estimator уже доступен в Лингвистической лаборатории.
Прохождение занимает всего несколько минут.
И даже если результат будет лишь приблизительным, это всё равно часто лучше, чем совсем расплывчатое представление о собственном словаре.
Обсуждение