Библиотека собеса по Data Science | вопросы с собеседований

Какая проблема возникает, когда распределение входных данных (признаков X) в тестовой среде отличается от распределения, на котором обучалась модель, но при этом связь между входными данными и целевой переменной (P(Y∣X)) остается неизменной?

Anonymous Quiz

19%

Дисперсионный сдвиг (Variance Shift)

25%

Дисперсионный сдвиг (Variance Shift)

19%

Сдвиг метки (Label Shift)

38%

Ковариатный сдвиг (Covariate Shift)

👍1

167 voters615 views18:54

Библиотека собеса по Data Science | вопросы с собеседований

Вы обучаете глубокую нейронную сеть, которая показывает 99% точности на обучающей выборке, но всего 70% на тестовой. Какое из следующих действий, скорее всего, поможет снизить переобучение (overfitting), не требуя сбора новых данных?

Anonymous Quiz

78%

Применить Dropout к скрытым слоям нейронной сети.

Использовать более простую функцию активации, например, сигмоиду вместо ReLU.

Уменьшить степень регуляризации $\lambda$ в функции потерь.

Удалить все признаки с низкой дисперсией (Low Variance).

213 voters644 views18:26

Библиотека собеса по Data Science | вопросы с собеседований

Вы строите модель и обнаруживаете, что хотя общая метрика производительности высока, индивидуальные p-значения большинства ваших переменных незначимы, а коэффициенты (weights) модели демонстрируют высокую чувствительность к небольшим изменениям в данных.

Anonymous Quiz

30%

Гетероскедастичность (Heteroscedasticity)

12%

Недообучение (Underfitting)

47%

Мультиколлинеарность (Multicollinearity)

11%

Автокорреляция остатков (Autocorrelation of Residuals)

❤2

159 voters641 views17:48

Библиотека собеса по Data Science | вопросы с собеседований

Вы используете SVM для классификации, но обнаружили, что данные не являются линейно разделимыми в исходном пространстве признаков.

Какая техника позволяет SVM классифицировать нелинейные данные, не увеличивая явно размерность пространства?

Anonymous Quiz

60%

Ядерный трюк (Kernel Trick)

13%

Эластичная сеть (Elastic Net Regularization)

23%

Снижение размерности с помощью PCA

Случайная подвыборка признаков (Random Subspace)

❤1

177 voters614 views16:52

Библиотека собеса по Data Science | вопросы с собеседований

При использовании алгоритма k-ближайших соседей (k-NN) для классификации, какое влияние будет иметь слишком маленькое значение k (например, k=1) на поведение модели?

Anonymous Quiz

27%

Модель будет иметь высокое смещение (Bias) и страдать от недообучения (Underfitting)

10%

Модель будет иметь низкую дисперсию (Variance) и высокую обобщающую способность

53%

Модель будет иметь высокую дисперсию, быть очень чувствительной к шуму и переобучаться

Модель станет нечувствительной к масштабу признаков

❤2

195 voters554 views19:00

Библиотека собеса по Data Science | вопросы с собеседований

Вы разрабатываете рекомендательную систему для нового стримингового сервиса. Какая из перечисленных ниже ситуаций является классическим примером проблемы холодного старта (Cold Start Problem)?

Anonymous Quiz

11%

Алгоритм не может обработать новый жанр фильма, так как он не был представлен в обучающей выборке

86%

Система не может давать качественные рекомендации новому пользователю, поскольку у него нет истории

Алгоритм слишком сложен, что приводит к долгому времени отклика при генерации рекомендаций

👍5

181 voters526 views17:56

Библиотека собеса по Data Science | вопросы с собеседований

При оценке бинарного классификатора была построена Матрица ошибок. Какая метрика рассчитывается как отношение истинно положительных срабатываний ко всем фактически положительным случаям?

Anonymous Quiz

👍4🌚3

190 voters489 views18:18

Библиотека собеса по Data Science | вопросы с собеседований

Математика — это фильтр на входе

На собеседованиях по DS часто валят не на коде, а на вопросах по линейной алгебре, статам или терверу. Не дай теории стать твоим узким местом.

Уравнение выгоды: 1 + 2.

Берешь три курса, платишь за один (тот, что дороже).

Что усилит резюме:

— Математика для Data Science;
— AI-агенты для DS-специалистов;
— ML для старта.

Обучить свою нейронку

До 31 декабря.
Саппорт: @manager_proglib

458 views14:29

Библиотека собеса по Data Science | вопросы с собеседований

При использовании L1-регуляризации (Lasso) в линейных моделях коэффициенты при некоторых признаках становятся строго равными нулю. Какое геометрическое свойство L1-нормы объясняет этот эффект?

Anonymous Quiz

11%

L1-норма является дифференцируемой во всех точках пространства

68%

Единичная сфера L1-нормы имеет острые углы на осях координат

13%

Производная L1-нормы пропорциональна значению самого веса

L1-норма всегда меньше L2-нормы для любого вектора весов

149 voters432 views18:25

Библиотека собеса по Data Science | вопросы с собеседований

При обучении случайного леса (Random Forest) мы используем Out-of-Bag (OOB) ошибку. Что это такое?

Anonymous Quiz

13%

Ошибка, которую модель выдает на полностью новых данных после деплоя

11%

Ошибка, возникающая из-за того, что деревья в лесу слишком глубокие

Среднеквадратичная ошибка (MSE), рассчитанная по всей обучающей выборке

72%

Ошибка модели на данных, которые не попали в bootstrap-выборку для конкретного дерева

👍1

162 voters384 views18:51

Библиотека собеса по Data Science | вопросы с собеседований

Какой из методов ансамблирования обычно дает наибольший выигрыш в качестве, если базовые модели сильно различаются по своей архитектуре (например, KNN, SVM и случайный лес)?

Anonymous Quiz

17%

Бэггинг (Bagging)

27%

Градиентный бустинг (Boosting)

Случайный подпространственный метод (Random Subspace)

48%

Стэкинг (Stacking)

❤1

141 voters303 views18:12

Библиотека собеса по Data Science | вопросы с собеседований

Вопрос с собеседования 2026: «Как вы организуете память в мультиагентной системе?»

Если вы отвечаете «просто передам контекст в промпт», вы, скорее всего, не получите оффер на позицию AI Engineer. Современные системы требуют работы с векторными БД, чекпоинтами в графах и RAG.

Подтяните хард-скиллы на нашем обновленном курсе «Разработка AI-агентов».

Что в программе:

— Паттерн ReAct и архитектура агентов;
— Работа с LangChain и LangGraph ;
— Инструменты AgentOps для мониторинга.

Практика с код-ревью и дипломный проект, который не стыдно показать на собеседовании.

Записаться

147 views15:06

About

Blog

Apps

Platform