Распознаёт текст на фото, сканах и даже кривых телефонных снимках с точностью, что ставит Google Vision в неловкое положение.
Что умеет:
Где будет полезно:
Пример использования:
from vllm import LLM, SamplingParams
from PIL import Image
from transformers import AutoProcessor
def clean_repeated_substrings(text):
"""Clean repeated substrings in text"""
n = len(text)
if n<8000:
return text
for length in range(2, n // 10 + 1):
candidate = text[-length:]
count = 0
i = n - length
while i >= 0 and text[i:i + length] == candidate:
count += 1
i -= length
if count >= 10:
return text[:n - length * (count - 1)]
return text
model_path = "tencent/HunyuanOCR"
llm = LLM(model=model_path, trust_remote_code=True)
processor = AutoProcessor.from_pretrained(model_path)
sampling_params = SamplingParams(temperature=0, max_tokens=16384)
img_path = "/path/to/image.jpg"
img = Image.open(img_path)
messages = [
{"role": "system", "content": ""},
{"role": "user", "content": [
{"type": "image", "image": img_path},
{"type": "text", "text": "检测并识别图片中的文字,将文本坐标格式化输出。"}
]}
]
prompt = processor.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
inputs = {"prompt": prompt, "multi_modal_data": {"image": [img]}}
output = llm.generate([inputs], sampling_params)[0]
print(clean_repeated_substrings(output.outputs[0].text))
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍48🔥30❤3
Forwarded from 404
Лучшую фотонейросеть завезли на LMarena, и пользоваться ей можно даже без 3БУКВЫ и без регистрации.
Самое время клепать крутые фотки и арты!
#нейросеть #soft
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥35👍13❤4🤯3
This media is not supported in your browser
VIEW IN TELEGRAM
Работает с:
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33🔥11❤9😱6
Исследователи из GreyNoise выкатили сервис, который за пару секунд покажет, светился ли ваш IP в ботнетах, DDoS-сетях и подозрительных активностях.
Можно проверить и домашний интернет, и свой сервис (тот самый «на три буквы») — вдруг уже бьют в дверь, а вы не в курсе.
#soft #cybersec
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍33❤7🔥6🫡6
Я был максимально далёк от трейдинга. Но однажды решил: почему бы не заставить машину прогнозировать рынок?
История о том, как я прошёл путь от полного нуля до рабочей торговой стратегии, которая теперь приносит деньги.
#python #article #soft #code
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🔥6😱5❤4
Проект от CursorTouch позволяет управлять веб-страницами через простой JSON-интерфейс:
вы описываете, что нужно получить, а Web-Navigator сам открывает страницу, кликает, вводит текст, собирает данные и возвращает чистый результат.
Что умеет:
— Переходы по страницам.
— Клики по CSS-селектору.
— Заполнение форм.
— Авторизация.
— Интерактивные действия с JS-элементами.
— Парсинг карточек товаров.
— Сбор цен, аналитики, отзывов.
— Извлечение текста, таблиц, HTML-блоков.
— Скрапинг сайтов, которые обычным парсером не взять.
Все инструкции — через JSON или обычный запрос, а Web-Navigator делает всю «грязную работу».
Идеально подходит для:
* Telegram-ботов
* Dashboard-систем
* Автоматизации отчётов
* Ноутбуков аналитиков
* Бизнес-роботов
Зачем?
Бизнесам нужно: цены конкурентов, мониторинг отзывов, сбор лидов, отслеживание изменений на сайтах.
Web-Navigator позволяет делать такие проекты быстро → высокая маржа.
Боты, которые:
* показывают цены с маркетплейсов
* отслеживают товар/наличие/скидки
* мониторят тендеры
* собирают вакансии с hh/superjob
* парсят недвижимость и уведомляют о новых предложениях
Накопители данных, отчёты, CRM-интеграции, выгрузки по расписанию.
Бизнесы готовы платить за экономию времени.
Это вообще золото.
Можно собрать мини-платформу:
* «Мониторинг цен конкурентов»
* «Парсер товаров с маркетплейсов»
* «Сбор новостей по ключевым словам»
* «Трекер новых публикаций на сайтах»
Платная подписка → стабильный доход.
Готовые JSON-скрипты:
* «Сбор цен с Озон»
* «Парсер Avito»
* «Парсер Wildberries»
* «Мониторинг новостей»
* «Парсер вакансий»
#python #soft #github
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26🔥19❤12