Дайджест ресурсов для построения модели детектирования речи
- Одна из прорывных статей по VAD за последние 10 лет. За основу архитектуры взяты слои GRU и CNN, есть быстрая версия, работающая на сыром оцифрованном потоке и более качественная, с предварительным мел-спектрограммным преобразованием.
- Репозиторий с блокнотом на pytorch. В реализации используется архитектура, похожая на приведенную в статье выше.
- Предобученный VAD с отличными результатами и ссылкой на репозиторий с примерами использования и сравнением с другими решениями. Создатели, к сожалению не делятся исходным кодом и архитектурой модели.
- Самое популярное классическое решение от гугла: webRTC VAD. Нетребовательное стабильное решение с недостатками, с которого стоит начать и с которым стоит сравнивать свое решение.
- Удобный пакет для работы со звуком на питон.
- Еще одно хорошее решение, обходящее webRTC.
- Статья про работу с аудио и представлением сигнала.
- Одна из прорывных статей по VAD за последние 10 лет. За основу архитектуры взяты слои GRU и CNN, есть быстрая версия, работающая на сыром оцифрованном потоке и более качественная, с предварительным мел-спектрограммным преобразованием.
- Репозиторий с блокнотом на pytorch. В реализации используется архитектура, похожая на приведенную в статье выше.
- Предобученный VAD с отличными результатами и ссылкой на репозиторий с примерами использования и сравнением с другими решениями. Создатели, к сожалению не делятся исходным кодом и архитектурой модели.
- Самое популярное классическое решение от гугла: webRTC VAD. Нетребовательное стабильное решение с недостатками, с которого стоит начать и с которым стоит сравнивать свое решение.
- Удобный пакет для работы со звуком на питон.
- Еще одно хорошее решение, обходящее webRTC.
- Статья про работу с аудио и представлением сигнала.
👍1
🧩🧠 Тест на сообразительность: 3 захватывающие головоломки, чтобы развлечься и потренировать мозг
Потребуется проявить смекалку и нестандартное мышление, чтобы найти решения за 9 минут.
🔗 Пройти тест
Потребуется проявить смекалку и нестандартное мышление, чтобы найти решения за 9 минут.
🔗 Пройти тест
❤5
📰 Новости из мира ИИ
Amazon и Гильдия авторов наконец-то нашли способ приостановить поток ИИ-сгенерированной белиберды: авторы самиздата теперь обязаны указывать в описании факт использования ИИ для перевода, создания текста и иллюстраций.
Meta* планирует выпуск супермощной LLM в начале 2024 года. Ожидается, что модель в несколько раз превзойдет Llama-2* и станет главным конкурентом Gemini и GPT-4.
Исследовали MIT создали революционную модель компьютерного зрения EfficientViT, которая обрабатывает изображения с высоким разрешением в 9 раз быстрее любой другой существующей модели.
В Финляндии к обучению ИИ начали привлекать заключенных – они знают финский язык, их труд оплачивается по минимальной ставке (6 евро за 6-часовую смену) – на свободе таких работников просто не найти. А кроме того, тюремное начальство считает, что «ИИ работа» готовит правонарушителей к адаптации в новом цифровом мире.
Массовое внедрение ИИ привело к повышению уровня потребления воды инфраструктурой ИТ-гигантов – Microsoft сообщает о 34% росте за 2022 год, а Google – о 20%. Исследователи подсчитали, что на обработку 5-50 промптов (в зависимости от времени года и расположения серверов) ChatGPT тратит 0,5 л воды
Stability AI выпустила новинку – модель Stable Audio для генерации звуковых эффектов, речи и музыки по текстовому описанию. Бесплатно можно сгенерировать 20 треков (продолжительностью до 45 секунд) в месяц.
Журнал TIME опубликовал список
100 самых влиятельных людей в ИИ. Андрей Карпаты и Илья Суцкевер в списке отсутствуют, и многих обозревателей этот факт удивил.
Amazon и Гильдия авторов наконец-то нашли способ приостановить поток ИИ-сгенерированной белиберды: авторы самиздата теперь обязаны указывать в описании факт использования ИИ для перевода, создания текста и иллюстраций.
Meta* планирует выпуск супермощной LLM в начале 2024 года. Ожидается, что модель в несколько раз превзойдет Llama-2* и станет главным конкурентом Gemini и GPT-4.
Исследовали MIT создали революционную модель компьютерного зрения EfficientViT, которая обрабатывает изображения с высоким разрешением в 9 раз быстрее любой другой существующей модели.
В Финляндии к обучению ИИ начали привлекать заключенных – они знают финский язык, их труд оплачивается по минимальной ставке (6 евро за 6-часовую смену) – на свободе таких работников просто не найти. А кроме того, тюремное начальство считает, что «ИИ работа» готовит правонарушителей к адаптации в новом цифровом мире.
Массовое внедрение ИИ привело к повышению уровня потребления воды инфраструктурой ИТ-гигантов – Microsoft сообщает о 34% росте за 2022 год, а Google – о 20%. Исследователи подсчитали, что на обработку 5-50 промптов (в зависимости от времени года и расположения серверов) ChatGPT тратит 0,5 л воды
Stability AI выпустила новинку – модель Stable Audio для генерации звуковых эффектов, речи и музыки по текстовому описанию. Бесплатно можно сгенерировать 20 треков (продолжительностью до 45 секунд) в месяц.
Журнал TIME опубликовал список
100 самых влиятельных людей в ИИ. Андрей Карпаты и Илья Суцкевер в списке отсутствуют, и многих обозревателей этот факт удивил.
👍1
Forwarded from Библиотека программиста | программирование, кодинг, разработка
Диаграмма рабочего процесса, охватывающая все аспекты, связанные с необходимостью уведомлять пользователя о сообщении в Slack
🤔Это отличный пример того, почему разработка простой фичи может занять гораздо больше времени, чем думают многие. И да, статье уже 6 лет, но на архитектурные решения команды Slack стоит обращать внимание.
😉Покажите это своему продакту, если в следующий раз услышите в свой адрес что-то вроде «…там же все так просто».
🔗 Источник
#проектирование_систем
🤔Это отличный пример того, почему разработка простой фичи может занять гораздо больше времени, чем думают многие. И да, статье уже 6 лет, но на архитектурные решения команды Slack стоит обращать внимание.
😉Покажите это своему продакту, если в следующий раз услышите в свой адрес что-то вроде «…там же все так просто».
🔗 Источник
#проектирование_систем
🐍 Дорожная карта Python-разработчика в 2023 году
Расскажем, что и в какой последовательности нужно изучить, чтобы стать Python-джуном и найти первую работу.
Читать статью
Кстати, начать можно с вводных занятий на нашем курсе – https://proglib.io/w/92b826c1
Расскажем, что и в какой последовательности нужно изучить, чтобы стать Python-джуном и найти первую работу.
Читать статью
Кстати, начать можно с вводных занятий на нашем курсе – https://proglib.io/w/92b826c1
👍2
🥳 Мы рады объявить о запуске новой еженедельной email-рассылки, посвященной последним новостям и тенденциям в мире искусственного интеллекта. Наша цель – держать подписчиков в курсе самых интересных открытий, исследований и приложений ИИ.
🤖 В рассылке вы найдете:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей.
● Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
● Статьи об этических аспектах развития технологий.
● Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
● Обзоры инструментов и библиотек для разработки нейронных сетей.
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
● Фильмы, сериалы и книги, которые заслуживают внимания AI энтузиастов.
🔥 Подписаться
🤖 В рассылке вы найдете:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей.
● Материалы о применении ИИ в разных сферах – медицине, бизнесе, науке, производстве и образовании.
● Статьи об этических аспектах развития технологий.
● Подборки лучших онлайн-курсов и видеолекций по машинному обучению.
● Обзоры инструментов и библиотек для разработки нейронных сетей.
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов.
● Фильмы, сериалы и книги, которые заслуживают внимания AI энтузиастов.
🔥 Подписаться
🔥3
Напоминаем, у вас есть возможность начать любой курс бесплатно!
На вводной части вы сможете познакомиться с программой курса, форматом обучения и преподавателями.
Что выбрать?
🔹 Математика для Data Science
Наш самый популярный, самый хардкорный курс по вышмату! На этом курсе вы получите все необходимые знания по математике для старта карьеры в DS или аналитике.
🔹 Алгоритмы и структуры данных
Курс, который на практике познакомит со сложными алгоритмами и научит писать более короткий и эффективный код.
🔹 Основы программирования на Python
Если вы только хотите начать свою карьеру в IT, то рекомендуем рассмотреть именно этот курс.
Если вы не знаете, какой курс вам подойдет, оставляйте заявку, и наш менеджер поможет с этим и любым другим вопросом. – https://proglib.io/w/cff56588
На вводной части вы сможете познакомиться с программой курса, форматом обучения и преподавателями.
Что выбрать?
🔹 Математика для Data Science
Наш самый популярный, самый хардкорный курс по вышмату! На этом курсе вы получите все необходимые знания по математике для старта карьеры в DS или аналитике.
🔹 Алгоритмы и структуры данных
Курс, который на практике познакомит со сложными алгоритмами и научит писать более короткий и эффективный код.
🔹 Основы программирования на Python
Если вы только хотите начать свою карьеру в IT, то рекомендуем рассмотреть именно этот курс.
Если вы не знаете, какой курс вам подойдет, оставляйте заявку, и наш менеджер поможет с этим и любым другим вопросом. – https://proglib.io/w/cff56588
🔥1
Когда какие базы данных лучше использовать?
Большой обзор видов баз данных. В нынешних реалиях даже research engineer должен уметь работать с базами данных, но с развитием технологий (особенно с появлением LLM) уже не очевидно, что всегда лучший вариант - хранить данные в sql.
Большой обзор видов баз данных. В нынешних реалиях даже research engineer должен уметь работать с базами данных, но с развитием технологий (особенно с появлением LLM) уже не очевидно, что всегда лучший вариант - хранить данные в sql.
👍1
Какие минимальные требования есть к специалистам в сфере Data Science?
🔹Hard skills
▪️ Писать на Python
▪️ Разбираться в алгоритмах для рекомендательных систем
▪️ Знание статестических и математических методов
▪️ Визуализация данных
🔹 Soft skills
▪️ Аналитическое и критическое мышление
▪️ Адаптивность и гибкость
▪️ Постоянное стремление к саморазвитию и обучению
▪️ Эмоциональный интеллект и решительность
Специалисты в Data Science сейчас очень востребованы, но к ним предъявляют высокие требования даже на уровне Junior.
В сферу Data Science часто переходят разработчики из смежных областей, которые пишут на Python. Если это ваш случай, однозначно рекомендуем подтянуть знания по математике, чтобы увеличить свои шансы на трудоустройство.
Посмотрите программу курса «Математика для Data Science», которая была разработана совместно с преподавателями МГУ. Курс довольно сложный, но после его прохождения, вы точно будете готовы к самым трудным заданиям на собеседованиях.
ПОСМОТРЕТЬ ПРОГРАММУ
🔹Hard skills
▪️ Писать на Python
▪️ Разбираться в алгоритмах для рекомендательных систем
▪️ Знание статестических и математических методов
▪️ Визуализация данных
🔹 Soft skills
▪️ Аналитическое и критическое мышление
▪️ Адаптивность и гибкость
▪️ Постоянное стремление к саморазвитию и обучению
▪️ Эмоциональный интеллект и решительность
Специалисты в Data Science сейчас очень востребованы, но к ним предъявляют высокие требования даже на уровне Junior.
В сферу Data Science часто переходят разработчики из смежных областей, которые пишут на Python. Если это ваш случай, однозначно рекомендуем подтянуть знания по математике, чтобы увеличить свои шансы на трудоустройство.
Посмотрите программу курса «Математика для Data Science», которая была разработана совместно с преподавателями МГУ. Курс довольно сложный, но после его прохождения, вы точно будете готовы к самым трудным заданиям на собеседованиях.
ПОСМОТРЕТЬ ПРОГРАММУ
👍1
Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
Старый добрый LDA
Часто в NLP для решения некоторых задач все еще используется метод Latent Dirichlet Allocation (LDA) - подход для тематического моделирования. Основная задача ТМ заключается в том что бы полученные темы были хорошего качество, понятными, самозначимыми и разделенными. Достижение этих целей во многом зависит от качества предварительной обработки текста и стратегии поиска оптимального количества тем. Алгоритм реализован в sklearn и gensim, но решение gensim кажется более простым в использовании и удобным и о нем вместе с предобработкой данных пойдет речь в статье по ссылке.
Часто в NLP для решения некоторых задач все еще используется метод Latent Dirichlet Allocation (LDA) - подход для тематического моделирования. Основная задача ТМ заключается в том что бы полученные темы были хорошего качество, понятными, самозначимыми и разделенными. Достижение этих целей во многом зависит от качества предварительной обработки текста и стратегии поиска оптимального количества тем. Алгоритм реализован в sklearn и gensim, но решение gensim кажется более простым в использовании и удобным и о нем вместе с предобработкой данных пойдет речь в статье по ссылке.
👍1
Шутка смешная, ситуация страшная.. Не делайте так, изучите алгоритмы и структуры данных, чтобы ваш код понимали не только вы 🙂
😁9
Cегодня хотим поделиться обратной связью от выпускника курса «Алгоритмы и структуры данных»
Илья – Regular Java developer
Почему ты решил пойти учиться?
Мое образование хоть и связано с вычислительной техникой, но больше хотелось академического курса для программистов. Моей цели курс полностью соответствовал.
Что тебе больше всего понравилось на курсе?
В целом все понравилось. Все основные темы были затронуты, которые мне были нужны.
Как ты оцениваешь свой уровень знаний до начала обучения? Может ты уже знал какие-то темы или начинал все с нуля?
До обучения уровень знаний – 5, после обучения 7, но я еще прошел не весь курс.
Дай общую оценку от 1 до 10 нашему курсу: с какой вероятностью ты бы порекомендовал его друзьям?
Порекомендовал бы на 10 из 10. Мне все понравилось. Считаю, что это лучший курс по алгоритмам на русском языке, который мне встречался.
Помог ли тебе наш курс в достижении этих целей?
Да. Я успел прособеседоваться на несколько крупных проектов. Теперь техничение собеседования – это моя сильная сторона, hr подмечали это.
Если вы также хотите преуспеть на техническом собеседовании, то оставляйте заявку и наш менеджер пришлет вам демо-доступ курса «Алгоритмы и структуры данных» – https://proglib.io/w/203331d3
Илья – Regular Java developer
Почему ты решил пойти учиться?
Мое образование хоть и связано с вычислительной техникой, но больше хотелось академического курса для программистов. Моей цели курс полностью соответствовал.
Что тебе больше всего понравилось на курсе?
В целом все понравилось. Все основные темы были затронуты, которые мне были нужны.
Как ты оцениваешь свой уровень знаний до начала обучения? Может ты уже знал какие-то темы или начинал все с нуля?
До обучения уровень знаний – 5, после обучения 7, но я еще прошел не весь курс.
Дай общую оценку от 1 до 10 нашему курсу: с какой вероятностью ты бы порекомендовал его друзьям?
Порекомендовал бы на 10 из 10. Мне все понравилось. Считаю, что это лучший курс по алгоритмам на русском языке, который мне встречался.
Помог ли тебе наш курс в достижении этих целей?
Да. Я успел прособеседоваться на несколько крупных проектов. Теперь техничение собеседования – это моя сильная сторона, hr подмечали это.
Если вы также хотите преуспеть на техническом собеседовании, то оставляйте заявку и наш менеджер пришлет вам демо-доступ курса «Алгоритмы и структуры данных» – https://proglib.io/w/203331d3
Где вы сейчас проживаете?
Anonymous Poll
68%
Россия
18%
Страны СНГ (Грузия, Казахстан, Армения и тд)
11%
В Европе
1%
В Азии
3%
Другое
Какие из этих тем вам интересны?
Anonymous Poll
44%
Data Science (навыки, задачки, направления, старт карьеры и тд)
41%
ML/ИИ (новости, задачки, полезные материалы)
47%
Техническое собеседование, алгоритмы
25%
Как начать карьеру в IT
31%
Python (с чего начать, фишки, кейсы, новости)
13%
Ничего из перечисленного
🔎💼🗺️ Как программисту искать (и найти) работу за границей в 2023 году
Разбираемся: где искать работу за рубежом, как и где откликаться на вакансии, плюс несколько лайфхаков по составлению резюме.
Читать статью
Разбираемся: где искать работу за рубежом, как и где откликаться на вакансии, плюс несколько лайфхаков по составлению резюме.
Читать статью
👀 Базовые модели ML и приложения
Это наш новый курс для начинающих в теме машинного обучения🎉
🔹 Познакомитесь с основными моделями машинного обучения
🔹 Научитесь выбирать и применять подходящие tree-based модели
🔹 Получите основу для дальнейшего изучения более сложных нейронных сетей
Подробности – https://proglib.io/w/ca643d1c
Кому будет полезен курс?
Начинающим в IT. Тем, кто выбирает направление и хочет попробовать себя в ML
Математикам. Увлекаетесь математикой и хотите перейти от теории к практике, а также научиться решать реальные бизнес-задачи
Ну и главное, до конца сентября вы сможете получить этот курс бесплатно🤯
Пока ссылки нет на основном сайте, мы открываем продажи супер-акцией для своих 🙌 – https://proglib.io/w/ca643d1c
Переходите на сайт, читайте подробности и заходите на обучение по самым выгодным условиям!
Это наш новый курс для начинающих в теме машинного обучения🎉
🔹 Познакомитесь с основными моделями машинного обучения
🔹 Научитесь выбирать и применять подходящие tree-based модели
🔹 Получите основу для дальнейшего изучения более сложных нейронных сетей
Подробности – https://proglib.io/w/ca643d1c
Кому будет полезен курс?
Начинающим в IT. Тем, кто выбирает направление и хочет попробовать себя в ML
Математикам. Увлекаетесь математикой и хотите перейти от теории к практике, а также научиться решать реальные бизнес-задачи
Ну и главное, до конца сентября вы сможете получить этот курс бесплатно🤯
Пока ссылки нет на основном сайте, мы открываем продажи супер-акцией для своих 🙌 – https://proglib.io/w/ca643d1c
Переходите на сайт, читайте подробности и заходите на обучение по самым выгодным условиям!
🔥2