В чем разница между машинным обучением с учителем и без учителя?
Для обучения с учителем требуются данные, помеченные для обучения. Например, чтобы провести классификацию (задача обучения с учителем), вам нужно сначала пометить данные, которые вы будете использовать для обучения модели, для классификации данных по помеченным группам; в то же время обучение без учителя не требует явной маркировки
#вопросы_с_собеседований
Для обучения с учителем требуются данные, помеченные для обучения. Например, чтобы провести классификацию (задача обучения с учителем), вам нужно сначала пометить данные, которые вы будете использовать для обучения модели, для классификации данных по помеченным группам; в то же время обучение без учителя не требует явной маркировки
#вопросы_с_собеседований
🤖Собрали для вас нейросети для разработки (помимо Chat GPT) — сохраняйте и тестируйте⬇️
🔍Code Mentor оптимизирует и рефакторит код
🔍Copilot by GitHub помогает писать код и дополняет его своими предложениями
🔍ExplainDev обучает в процессе и помогает разобраться в коде
🔍GPT Engineer может всю работу сделать за вас — нужно только сказать, что хотите написать
🔍CodeT5 преобразовывает запрос в код и дописывает начатые функции
🔍Polycoder бесплатный помощник, который способен генерировать код на 12 языках программирования
🔍Tabnine дописывает код за вами — даже полноценные строчки (но только в платной версии)
🔍Mintlify пишет документацию и комментарии
🔍Cogram переводит запрос на язык баз данных и интегрируется со средой разработки Jupyter
Бонус:
👨🏫Agent GPT устанавливает в вашем браузере ИИ-агента, который помогает в выполнении поставленной задачи (можно использовать не только при разработке, но и при планировании путешествия и для других личных задач)
🔍Code Mentor оптимизирует и рефакторит код
🔍Copilot by GitHub помогает писать код и дополняет его своими предложениями
🔍ExplainDev обучает в процессе и помогает разобраться в коде
🔍GPT Engineer может всю работу сделать за вас — нужно только сказать, что хотите написать
🔍CodeT5 преобразовывает запрос в код и дописывает начатые функции
🔍Polycoder бесплатный помощник, который способен генерировать код на 12 языках программирования
🔍Tabnine дописывает код за вами — даже полноценные строчки (но только в платной версии)
🔍Mintlify пишет документацию и комментарии
🔍Cogram переводит запрос на язык баз данных и интегрируется со средой разработки Jupyter
Бонус:
👨🏫Agent GPT устанавливает в вашем браузере ИИ-агента, который помогает в выполнении поставленной задачи (можно использовать не только при разработке, но и при планировании путешествия и для других личных задач)
👍3
Что такое рекуррентные нейронные сети (RNN)?
Рекуррентные нейронные сети — это вид нейросетей, в которых связи между элементами образуют направленную последовательность. Это позволяет обрабатывать серии событий во времени или последовательные пространственные цепочки.
Они используются преимущественно для задач, где нечто цельное состоит из ряда объектов, например при распознавании рукописного текста или речи.
#вопросы_с_собеседований
Рекуррентные нейронные сети — это вид нейросетей, в которых связи между элементами образуют направленную последовательность. Это позволяет обрабатывать серии событий во времени или последовательные пространственные цепочки.
Они используются преимущественно для задач, где нечто цельное состоит из ряда объектов, например при распознавании рукописного текста или речи.
#вопросы_с_собеседований
👍2
Forwarded from Библиотека программиста | программирование, кодинг, разработка
This media is not supported in your browser
VIEW IN TELEGRAM
#инфографика #проектирование_систем
🤔 Как устроены языки программирования на базовом уровне? Разбираемся на примере C++, Java, Python
📌C++
• Парадигмы: процедурное, объектно-ориентированное, функциональное, обобщенное программирование.
• Типизация: статическая.
• Компиляция/Выполнение: компилируется в машинный код для конкретной платформы. Не требует виртуальной машины или интерпретатора для выполнения.
• Особенности: управление памятью осуществляется вручную с использованием операторов new и delete.
• Использование: системное программирование, разработка приложений и игр, высокопроизводительные приложения.
📌Java
• Парадигмы: объектно-ориентированное, частичное функциональное программирование (с Java 8).
• Типизация: статическая.
• Компиляция/Выполнение: компилируется в байт-код, который затем интерпретируется или компилируется JIT-компилятором на Java Virtual Machine (JVM).
• Особенности: автоматическое управление памятью с использованием сборщика мусора. «Напиши раз, запусти везде» благодаря JVM.
• Использование: веб-разработка, мобильная разработка (Android), корпоративные приложения, встроенные системы.
Python:
• Парадигмы: процедурное, объектно-ориентированное, функциональное программирование.
• Типизация: динамическая.
• Компиляция/Выполнение: интерпретируемый. Байт-код Python выполняется на Python-интерпретаторе.
• Особенности: легко читаемый синтаксис, управление памятью с помощью сборщика мусора, богатая стандартная библиотека.
• Использование: веб-разработка, научные вычисления, обработка данных, искусственный интеллект, автоматизация.
🧰 Механизмы работы
• C++: прямая компиляция в машинный код для определенной ОС и архитектуры.
• Java: компиляция в байт-код, который затем выполняется на JVM, обеспечивая кросс-платформенность.
• Python: интерпретация исходного кода с помощью Python-интерпретатора.
📌C++
• Парадигмы: процедурное, объектно-ориентированное, функциональное, обобщенное программирование.
• Типизация: статическая.
• Компиляция/Выполнение: компилируется в машинный код для конкретной платформы. Не требует виртуальной машины или интерпретатора для выполнения.
• Особенности: управление памятью осуществляется вручную с использованием операторов new и delete.
• Использование: системное программирование, разработка приложений и игр, высокопроизводительные приложения.
📌Java
• Парадигмы: объектно-ориентированное, частичное функциональное программирование (с Java 8).
• Типизация: статическая.
• Компиляция/Выполнение: компилируется в байт-код, который затем интерпретируется или компилируется JIT-компилятором на Java Virtual Machine (JVM).
• Особенности: автоматическое управление памятью с использованием сборщика мусора. «Напиши раз, запусти везде» благодаря JVM.
• Использование: веб-разработка, мобильная разработка (Android), корпоративные приложения, встроенные системы.
Python:
• Парадигмы: процедурное, объектно-ориентированное, функциональное программирование.
• Типизация: динамическая.
• Компиляция/Выполнение: интерпретируемый. Байт-код Python выполняется на Python-интерпретаторе.
• Особенности: легко читаемый синтаксис, управление памятью с помощью сборщика мусора, богатая стандартная библиотека.
• Использование: веб-разработка, научные вычисления, обработка данных, искусственный интеллект, автоматизация.
• C++: прямая компиляция в машинный код для определенной ОС и архитектуры.
• Java: компиляция в байт-код, который затем выполняется на JVM, обеспечивая кросс-платформенность.
• Python: интерпретация исходного кода с помощью Python-интерпретатора.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Дайджест ресурсов для построения модели детектирования речи
- Одна из прорывных статей по VAD за последние 10 лет. За основу архитектуры взяты слои GRU и CNN, есть быстрая версия, работающая на сыром оцифрованном потоке и более качественная, с предварительным мел-спектрограммным преобразованием.
- Репозиторий с блокнотом на pytorch. В реализации используется архитектура, похожая на приведенную в статье выше.
- Предобученный VAD с отличными результатами и ссылкой на репозиторий с примерами использования и сравнением с другими решениями. Создатели, к сожалению не делятся исходным кодом и архитектурой модели.
- Самое популярное классическое решение от гугла: webRTC VAD. Нетребовательное стабильное решение с недостатками, с которого стоит начать и с которым стоит сравнивать свое решение.
- Удобный пакет для работы со звуком на питон.
- Еще одно хорошее решение, обходящее webRTC.
- Статья про работу с аудио и представлением сигнала.
- Одна из прорывных статей по VAD за последние 10 лет. За основу архитектуры взяты слои GRU и CNN, есть быстрая версия, работающая на сыром оцифрованном потоке и более качественная, с предварительным мел-спектрограммным преобразованием.
- Репозиторий с блокнотом на pytorch. В реализации используется архитектура, похожая на приведенную в статье выше.
- Предобученный VAD с отличными результатами и ссылкой на репозиторий с примерами использования и сравнением с другими решениями. Создатели, к сожалению не делятся исходным кодом и архитектурой модели.
- Самое популярное классическое решение от гугла: webRTC VAD. Нетребовательное стабильное решение с недостатками, с которого стоит начать и с которым стоит сравнивать свое решение.
- Удобный пакет для работы со звуком на питон.
- Еще одно хорошее решение, обходящее webRTC.
- Статья про работу с аудио и представлением сигнала.
👍1
🧩🧠 Тест на сообразительность: 3 захватывающие головоломки, чтобы развлечься и потренировать мозг
Потребуется проявить смекалку и нестандартное мышление, чтобы найти решения за 9 минут.
🔗 Пройти тест
Потребуется проявить смекалку и нестандартное мышление, чтобы найти решения за 9 минут.
🔗 Пройти тест
❤5
📰 Новости из мира ИИ
Amazon и Гильдия авторов наконец-то нашли способ приостановить поток ИИ-сгенерированной белиберды: авторы самиздата теперь обязаны указывать в описании факт использования ИИ для перевода, создания текста и иллюстраций.
Meta* планирует выпуск супермощной LLM в начале 2024 года. Ожидается, что модель в несколько раз превзойдет Llama-2* и станет главным конкурентом Gemini и GPT-4.
Исследовали MIT создали революционную модель компьютерного зрения EfficientViT, которая обрабатывает изображения с высоким разрешением в 9 раз быстрее любой другой существующей модели.
В Финляндии к обучению ИИ начали привлекать заключенных – они знают финский язык, их труд оплачивается по минимальной ставке (6 евро за 6-часовую смену) – на свободе таких работников просто не найти. А кроме того, тюремное начальство считает, что «ИИ работа» готовит правонарушителей к адаптации в новом цифровом мире.
Массовое внедрение ИИ привело к повышению уровня потребления воды инфраструктурой ИТ-гигантов – Microsoft сообщает о 34% росте за 2022 год, а Google – о 20%. Исследователи подсчитали, что на обработку 5-50 промптов (в зависимости от времени года и расположения серверов) ChatGPT тратит 0,5 л воды
Stability AI выпустила новинку – модель Stable Audio для генерации звуковых эффектов, речи и музыки по текстовому описанию. Бесплатно можно сгенерировать 20 треков (продолжительностью до 45 секунд) в месяц.
Журнал TIME опубликовал список
100 самых влиятельных людей в ИИ. Андрей Карпаты и Илья Суцкевер в списке отсутствуют, и многих обозревателей этот факт удивил.
Amazon и Гильдия авторов наконец-то нашли способ приостановить поток ИИ-сгенерированной белиберды: авторы самиздата теперь обязаны указывать в описании факт использования ИИ для перевода, создания текста и иллюстраций.
Meta* планирует выпуск супермощной LLM в начале 2024 года. Ожидается, что модель в несколько раз превзойдет Llama-2* и станет главным конкурентом Gemini и GPT-4.
Исследовали MIT создали революционную модель компьютерного зрения EfficientViT, которая обрабатывает изображения с высоким разрешением в 9 раз быстрее любой другой существующей модели.
В Финляндии к обучению ИИ начали привлекать заключенных – они знают финский язык, их труд оплачивается по минимальной ставке (6 евро за 6-часовую смену) – на свободе таких работников просто не найти. А кроме того, тюремное начальство считает, что «ИИ работа» готовит правонарушителей к адаптации в новом цифровом мире.
Массовое внедрение ИИ привело к повышению уровня потребления воды инфраструктурой ИТ-гигантов – Microsoft сообщает о 34% росте за 2022 год, а Google – о 20%. Исследователи подсчитали, что на обработку 5-50 промптов (в зависимости от времени года и расположения серверов) ChatGPT тратит 0,5 л воды
Stability AI выпустила новинку – модель Stable Audio для генерации звуковых эффектов, речи и музыки по текстовому описанию. Бесплатно можно сгенерировать 20 треков (продолжительностью до 45 секунд) в месяц.
Журнал TIME опубликовал список
100 самых влиятельных людей в ИИ. Андрей Карпаты и Илья Суцкевер в списке отсутствуют, и многих обозревателей этот факт удивил.
👍1
Forwarded from Библиотека программиста | программирование, кодинг, разработка
Диаграмма рабочего процесса, охватывающая все аспекты, связанные с необходимостью уведомлять пользователя о сообщении в Slack
🤔Это отличный пример того, почему разработка простой фичи может занять гораздо больше времени, чем думают многие. И да, статье уже 6 лет, но на архитектурные решения команды Slack стоит обращать внимание.
😉Покажите это своему продакту, если в следующий раз услышите в свой адрес что-то вроде «…там же все так просто».
🔗 Источник
#проектирование_систем
🤔Это отличный пример того, почему разработка простой фичи может занять гораздо больше времени, чем думают многие. И да, статье уже 6 лет, но на архитектурные решения команды Slack стоит обращать внимание.
😉Покажите это своему продакту, если в следующий раз услышите в свой адрес что-то вроде «…там же все так просто».
🔗 Источник
#проектирование_систем
🐍 Дорожная карта Python-разработчика в 2023 году
Расскажем, что и в какой последовательности нужно изучить, чтобы стать Python-джуном и найти первую работу.
Читать статью
Кстати, начать можно с вводных занятий на нашем курсе – https://proglib.io/w/92b826c1
Расскажем, что и в какой последовательности нужно изучить, чтобы стать Python-джуном и найти первую работу.
Читать статью
Кстати, начать можно с вводных занятий на нашем курсе – https://proglib.io/w/92b826c1
👍2
🥳 Мы рады объявить о запуске новой еженедельной email-рассылки, посвященной последним новостям и тенденциям в мире искусственного интеллекта. Наша цель – держать подписчиков в курсе самых интересных открытий, исследований и приложений ИИ.
🤖 В рассылке вы найдете:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей.
● Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
● Статьи об этических аспектах развития технологий.
● Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
● Обзоры инструментов и библиотек для разработки нейронных сетей.
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
● Фильмы, сериалы и книги, которые заслуживают внимания AI энтузиастов.
🔥 Подписаться
🤖 В рассылке вы найдете:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей.
● Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
● Статьи об этических аспектах развития технологий.
● Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
● Обзоры инструментов и библиотек для разработки нейронных сетей.
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
● Фильмы, сериалы и книги, которые заслуживают внимания AI энтузиастов.
🔥 Подписаться
🔥3
Напоминаем, у вас есть возможность начать любой курс бесплатно!
На вводной части вы сможете познакомиться с программой курса, форматом обучения и преподавателями.
Что выбрать?
🔹 Математика для Data Science
Наш самый популярный, самый хардкорный курс по вышмату! На этом курсе вы получите все необходимые знания по математике для старта карьеры в DS или аналитике.
🔹 Алгоритмы и структуры данных
Курс, который на практике познакомит со сложными алгоритмами и научит писать более короткий и эффективный код.
🔹 Основы программирования на Python
Если вы только хотите начать свою карьеру в IT, то рекомендуем рассмотреть именно этот курс.
Если вы не знаете, какой курс вам подойдет, оставляйте заявку, и наш менеджер поможет с этим и любым другим вопросом. – https://proglib.io/w/cff56588
На вводной части вы сможете познакомиться с программой курса, форматом обучения и преподавателями.
Что выбрать?
🔹 Математика для Data Science
Наш самый популярный, самый хардкорный курс по вышмату! На этом курсе вы получите все необходимые знания по математике для старта карьеры в DS или аналитике.
🔹 Алгоритмы и структуры данных
Курс, который на практике познакомит со сложными алгоритмами и научит писать более короткий и эффективный код.
🔹 Основы программирования на Python
Если вы только хотите начать свою карьеру в IT, то рекомендуем рассмотреть именно этот курс.
Если вы не знаете, какой курс вам подойдет, оставляйте заявку, и наш менеджер поможет с этим и любым другим вопросом. – https://proglib.io/w/cff56588
🔥1
Когда какие базы данных лучше использовать?
Большой обзор видов баз данных. В нынешних реалиях даже research engineer должен уметь работать с базами данных, но с развитием технологий (особенно с появлением LLM) уже не очевидно, что всегда лучший вариант - хранить данные в sql.
Большой обзор видов баз данных. В нынешних реалиях даже research engineer должен уметь работать с базами данных, но с развитием технологий (особенно с появлением LLM) уже не очевидно, что всегда лучший вариант - хранить данные в sql.
👍1
Какие минимальные требования есть к специалистам в сфере Data Science?
🔹Hard skills
▪️ Писать на Python
▪️ Разбираться в алгоритмах для рекомендательных систем
▪️ Знание статестических и математических методов
▪️ Визуализация данных
🔹 Soft skills
▪️ Аналитическое и критическое мышление
▪️ Адаптивность и гибкость
▪️ Постоянное стремление к саморазвитию и обучению
▪️ Эмоциональный интеллект и решительность
Специалисты в Data Science сейчас очень востребованы, но к ним предъявляют высокие требования даже на уровне Junior.
В сферу Data Science часто переходят разработчики из смежных областей, которые пишут на Python. Если это ваш случай, однозначно рекомендуем подтянуть знания по математике, чтобы увеличить свои шансы на трудоустройство.
Посмотрите программу курса «Математика для Data Science», которая была разработана совместно с преподавателями МГУ. Курс довольно сложный, но после его прохождения, вы точно будете готовы к самым трудным заданиям на собеседованиях.
ПОСМОТРЕТЬ ПРОГРАММУ
🔹Hard skills
▪️ Писать на Python
▪️ Разбираться в алгоритмах для рекомендательных систем
▪️ Знание статестических и математических методов
▪️ Визуализация данных
🔹 Soft skills
▪️ Аналитическое и критическое мышление
▪️ Адаптивность и гибкость
▪️ Постоянное стремление к саморазвитию и обучению
▪️ Эмоциональный интеллект и решительность
Специалисты в Data Science сейчас очень востребованы, но к ним предъявляют высокие требования даже на уровне Junior.
В сферу Data Science часто переходят разработчики из смежных областей, которые пишут на Python. Если это ваш случай, однозначно рекомендуем подтянуть знания по математике, чтобы увеличить свои шансы на трудоустройство.
Посмотрите программу курса «Математика для Data Science», которая была разработана совместно с преподавателями МГУ. Курс довольно сложный, но после его прохождения, вы точно будете готовы к самым трудным заданиям на собеседованиях.
ПОСМОТРЕТЬ ПРОГРАММУ
👍1
Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
Старый добрый LDA
Часто в NLP для решения некоторых задач все еще используется метод Latent Dirichlet Allocation (LDA) - подход для тематического моделирования. Основная задача ТМ заключается в том что бы полученные темы были хорошего качество, понятными, самозначимыми и разделенными. Достижение этих целей во многом зависит от качества предварительной обработки текста и стратегии поиска оптимального количества тем. Алгоритм реализован в sklearn и gensim, но решение gensim кажется более простым в использовании и удобным и о нем вместе с предобработкой данных пойдет речь в статье по ссылке.
Часто в NLP для решения некоторых задач все еще используется метод Latent Dirichlet Allocation (LDA) - подход для тематического моделирования. Основная задача ТМ заключается в том что бы полученные темы были хорошего качество, понятными, самозначимыми и разделенными. Достижение этих целей во многом зависит от качества предварительной обработки текста и стратегии поиска оптимального количества тем. Алгоритм реализован в sklearn и gensim, но решение gensim кажется более простым в использовании и удобным и о нем вместе с предобработкой данных пойдет речь в статье по ссылке.
👍1
Шутка смешная, ситуация страшная.. Не делайте так, изучите алгоритмы и структуры данных, чтобы ваш код понимали не только вы 🙂
😁9
Cегодня хотим поделиться обратной связью от выпускника курса «Алгоритмы и структуры данных»
Илья – Regular Java developer
Почему ты решил пойти учиться?
Мое образование хоть и связано с вычислительной техникой, но больше хотелось академического курса для программистов. Моей цели курс полностью соответствовал.
Что тебе больше всего понравилось на курсе?
В целом все понравилось. Все основные темы были затронуты, которые мне были нужны.
Как ты оцениваешь свой уровень знаний до начала обучения? Может ты уже знал какие-то темы или начинал все с нуля?
До обучения уровень знаний – 5, после обучения 7, но я еще прошел не весь курс.
Дай общую оценку от 1 до 10 нашему курсу: с какой вероятностью ты бы порекомендовал его друзьям?
Порекомендовал бы на 10 из 10. Мне все понравилось. Считаю, что это лучший курс по алгоритмам на русском языке, который мне встречался.
Помог ли тебе наш курс в достижении этих целей?
Да. Я успел прособеседоваться на несколько крупных проектов. Теперь техничение собеседования – это моя сильная сторона, hr подмечали это.
Если вы также хотите преуспеть на техническом собеседовании, то оставляйте заявку и наш менеджер пришлет вам демо-доступ курса «Алгоритмы и структуры данных» – https://proglib.io/w/203331d3
Илья – Regular Java developer
Почему ты решил пойти учиться?
Мое образование хоть и связано с вычислительной техникой, но больше хотелось академического курса для программистов. Моей цели курс полностью соответствовал.
Что тебе больше всего понравилось на курсе?
В целом все понравилось. Все основные темы были затронуты, которые мне были нужны.
Как ты оцениваешь свой уровень знаний до начала обучения? Может ты уже знал какие-то темы или начинал все с нуля?
До обучения уровень знаний – 5, после обучения 7, но я еще прошел не весь курс.
Дай общую оценку от 1 до 10 нашему курсу: с какой вероятностью ты бы порекомендовал его друзьям?
Порекомендовал бы на 10 из 10. Мне все понравилось. Считаю, что это лучший курс по алгоритмам на русском языке, который мне встречался.
Помог ли тебе наш курс в достижении этих целей?
Да. Я успел прособеседоваться на несколько крупных проектов. Теперь техничение собеседования – это моя сильная сторона, hr подмечали это.
Если вы также хотите преуспеть на техническом собеседовании, то оставляйте заявку и наш менеджер пришлет вам демо-доступ курса «Алгоритмы и структуры данных» – https://proglib.io/w/203331d3
Где вы сейчас проживаете?
Anonymous Poll
68%
Россия
18%
Страны СНГ (Грузия, Казахстан, Армения и тд)
11%
В Европе
1%
В Азии
3%
Другое