Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.5K subscribers
2.37K photos
119 videos
64 files
4.81K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Создайте свой собственный инструмент распознавания лиц с помощью Python

В этом руководстве вы создадите свой собственный инструмент командной строки для распознавания лиц с помощью Python. Вы узнаете, как использовать распознавание лиц, чтобы идентифицировать лица на изображении и маркировать их. Обладая этими знаниями, вы сможете создать свой собственный инструмент распознавания лиц от начала до конца!

Читать статью
В Python 3.13 удалили 20 модулей Stdlib

Разработчики ядра заняты работой над PEP 594, удалением севших батарей из Python 3.13. В этом длинном сообщении на дискуссионном форуме рассказывается о том, какая работа уже завершена.

Читать пост
🤔3
Для чего нужна стандартная библиотека Python?

В этой публикации резюмируется разговор на саммите Python Language Summit, в котором предлагается определить правила, когда что-то следует добавлять в стандартную библиотеку.

Читать статью
👍3
🤖🎮 GPT-4 играет в Minecraft и самообучается: сингулярность, в результате которой ИИ сам сделает себя умнее людей

В этой статье речь пойдет об эксперименте Voyager, в котором группа исследователей дала GPT-4 поиграть в Minecraft. Нейросеть сама учила себя играть, обучалась разным действиям вроде «срубить дерево» или «убить паука» и добавляла скиллы в свою библиотеку. Проще говоря, GPT-4 теперь пишет код, проверяет его и совершенствует. Именно с такого начинается так называемая сингулярность, в результате которой ИИ сам сделает себя умнее людей. Сингулярность Майнкрафта.

🔗 Основной сайт
🔗 Зеркало
👍7🔥1
Ведущий исследователь ИИ отвергает опасения «вымирания» ИИ и бросает вызов повествованию о «ученом-герое»

В недавнем интервью Кёнхён Чо, которого высоко ценят за его фундаментальную работу по нейронному машинному переводу, которая помогла разработать архитектуру Transformer, на которой основан ChatGPT, выразил разочарование по поводу отсутствия конкретных предложений на недавних слушаниях в Сенате, связанных с регулированием текущего вреда ИИ, а также отсутствием обсуждения того, как увеличить полезное использование ИИ.

Читать статью
👍31
Устраняют ли LLM необходимость в языках программирования?

Принимая во внимание новые инструменты разработки, основанные на модели большого языка (LLM), такие как Copilot и Ghostwriter, многие разработчики задаются вопросом о будущем программирования — имеют ли значение языки программирования, когда ИИ пишет код? Это большой вопрос! Он затрагивает суть рабочих процессов разработчиков, позволяет нам более широко размышлять об основном назначении инструментов программирования и побуждает нас поделиться нашим взглядом на то, как технологии кодирования будут развиваться в долгосрочной перспективе.

Читать статью
🤔3👍1
Приближение значений Шепли для машинного обучения

Вычисление значений Шепли для реальных сценариев использования в машинном обучении, как правило, невозможно с вычислительной точки зрения, поэтому на практике вместо них используются методы, которые их аппроксимируют. В этой статье рассмотрен простой подход к аппроксимации значений Шепли.

Читать статью
👍3
Каковы жестокие истины о работе в Data Science? [Обсуждение на Реддите]

Читать обсуждение
🔥8👍1🤔1
Руководству нужно, чтобы мы занимались генеративным ИИ. Что делать?

Идея для выступления возникла в результате многих бесед, которые я недавно провел с друзьями, которым нужно выяснить свою стратегию генеративного ИИ, но они не уверены, что именно делать… Этот доклад представляет собой простую основу для изучения того, что делать с генеративным ИИ. Многие идеи еще дорабатываются.

Читать статью
👍1
Несмотря на существование «лучших практик», большинство специалистов по работе с данными до сих пор описывают свои хранилища данных как полный беспорядок. Самый невинный вопрос «почему эти два числа разные?» Самый невинный вопрос «почему эти два числа разные?» может отправить аналитика или инженера данных в глубокую кроличью нору на несколько часов или дней. В посте автор пытается понять причину проблемы и найти решение.

Читать статью
👍3🔥1
Общие сведения о токенизаторах GPT

Большие языковые модели, такие как GPT-3/4, LLaMA и PaLM, работают в терминах токенов. Они берут текст, преобразуют его в токены (целые числа), а затем предсказывают, какие токены должны быть следующими. Поэкспериментировать с этими токенами — интересный способ получить лучшее представление о том, как эти штуки на самом деле работают под капотом. OpenAI предлагает инструмент Tokenizer для изучения того, как работают токены.

Читать статью
👍3
⚖️ 4 основных алгоритма сравнения Git Diff: когда и какой алгоритм использовать

Обзор четырех алгоритмов git diff: Майерса, минимальный, «терпения» и гистограммный. Также приводятся наглядные примеры, чтобы можно было сравнить результат применения каждого алгоритма самостоятельно.

🔗 Основной сайт
🔗 Зеркало
👍4
JupyterLab 4.0 уже здесь

Сообщество участников Jupyter анонсировало JupyterLab 4.0. В этом сообщении из блога показаны некоторые из новых фич, в том числе: улучшения производительности, обновления редактора, улучшенный поиск и многое другое.

Читать статью
👍5🔥2
Python для финансов: Pandas ресемплинг, группировка и роллинг

При работе с данными временных рядов, такими как финансовая информация, функции повторной выборки, группировки и прокрутки Pandas могут упростить вашу жизнь. Читайте дальше, чтобы узнать, как это сделать.

Читать статью
9😁1
Google только что выпустил бесплатный курс по искусственному интеллекту

Вот все, что вам нужно знать о пути обучения генеративному ИИ от Google.

Читать статью
👍12
Интервью с Мередит Уиттакер: «Это люди, которые могли бы приостановить ИИ, если бы захотели»

Президент некоммерческого приложения для обмена сообщениями о том, как, по ее мнению, экзистенциальные предупреждения об ИИ позволяют крупным технологиям укрепить свою власть, и почему законопроект о безопасности в Интернете может оказаться неработоспособным.

Читать статью
👍2
Когда врачи используют чат-бота, чтобы улучшить свою работу

Несмотря на недостатки обращения к искусственному интеллекту в медицине, некоторые врачи считают, что ChatGPT улучшает их способность общаться с пациентами.

Читать статью
Педагогические агенты на основе GPT-3 для обучения детей навыкам постановки любознательных вопросов

Чтобы тренировать способность детей задавать вопросы, вызванные любопытством, в предыдущих исследованиях изучалась разработка конкретных упражнений, основанных на предоставлении семантических и лингвистических подсказок, помогающих формулировать такие вопросы. Но, несмотря на педагогическую эффективность, этот метод все еще ограничен, поскольку он основан на генерировании указанных сигналов вручную, что может быть очень дорогостоящим процессом.

Читать исследование
Библиотека SciPy

SciPy — это библиотека, предназначенная для научных и технических вычислений на языке программирования Python. Она была создана для решения задач исследования данных, оптимизации, интерполяции, интегрирования, а также многих других задач, возникающих в науке и инженерных приложениях.

Одной из функций, широко используемых в SciPy, является функция scipy.stats.norm. Она используется для работы с нормальным распределением.

В данном примере мы импортировали функцию norm из библиотеки scipy.stats. Затем мы использовали метод cdf для расчета площади под кривой нормального распределения в диапазоне от -1 до 1.
#код
👍2
Scrapy

Scrapy - это фреймворк для извлечения данных из веб-сайтов
. Он используется для автоматического сбора структурированных данных из веб-страниц, таких как цены товаров, информация о продуктах, контактные данные и многое другое.

Этот код создает веб-паука, который извлекает цены товаров с сайта example.com. Он использует CSS-селекторы для поиска элементов страницы, содержащих информацию о продуктах, и извлекает их название и цену.
6
Что такое дескрипторы?

Дескрипторы — это механизм в Python, который позволяет настраивать доступ к атрибутам объектов. Они используются для определения поведения при доступе, изменении или удалении атрибута объекта.

Дескрипторы реализуются через три метода:

— __get__(self, instance, owner) вызывается при доступе к атрибуту
— __set__(self, instance, value) вызывается при изменении атрибута
— __delete__(self, instance) вызывается при удалении атрибута

Дескрипторы могут быть определены как отдельный класс или внутри другого класса. Они могут быть использованы для создания свойств, которые имеют специальное поведение при доступе, изменении или удалении.
#вопросы_с_собеседований
🔥9