mzo

官方 Claude Code 转发

官方 Claude Code 转发

🚀快速开始 点击右上角 系统公告🔔 可再次查看 | 完整内容可参考下方文档 ❓FAQ * 本站直接接入官方 Claude Code 转发,无法转发非 Claude Code 的 API 流量 * 如遇 API 报错,可能是转发代理不稳定导致,可以考虑重试几次 1️⃣ 安装 Node.js(已安装可跳过) 确保 Node.js 版本 ≥ 22.0 # Centos 用户 curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.1/install.sh | bash # 关闭并重新打开终端,或运行
mzo
阿里云发布Qwen VLo多模态模型 通过自然语言既能生成图像、也能编辑图像

阿里云发布Qwen VLo多模态模型 通过自然语言既能生成图像、也能编辑图像

Qwen VLo 是一个统一的多模态大模型(Unified Multimodal Model),能够既理解图像,又能生成、编辑图像,并通过自然语言指令灵活控制整个过程。 它不仅能“看懂”图像内容,还能根据理解进行精细的修改或全新创作,实现从 视觉感知到视觉生成 的闭环。 目前为预览版本,可通过 Qwen Chat 使用。 核心能力 1️⃣ 精准图像理解与内容重构 * 能准确识别图像中的物体类别、结构特征、风格风貌。 * 在进行图像修改时(如更换颜色、风格迁移),能保留原图重要结构,避免“变形”或“失真”。 举例: 用户上传一张汽车照片,说“把颜色换成蓝色”。 传统模型可能改变了轮廓或品牌识别失败;Qwen VLo 不仅识别出车型,还保留车体结构,仅自然改变颜色。 2️⃣ 开放式语言控制的图像编辑 Qwen VLo
mzo
阿里云发布 Qwen-TTS 语音合成模型 接近真人语音 支持普通话、英文,以及三种中文地方方言

阿里云发布 Qwen-TTS 语音合成模型 接近真人语音 支持普通话、英文,以及三种中文地方方言

阿里云发布 Qwen-TTS 高性能语音合成模型(Text-to-Speech,TTS)。其核心能力是将输入的中英文文本转换为具备自然表达力的语音输出。 与传统 TTS 模型相比,Qwen-TTS 最大的亮点在于: * 高自然度:声音表达更接近真人,具备情感、节奏、语调变化; * 多语种与方言支持:目前支持普通话、英文,以及三种中文方言(北京话、上海话、四川话); * 多音色选择:提供不同性别、语调和口音的声音,适配多样化场景。 语言与方言支持细节 支持的语音变体: 真实合成样例:https://qwenlm.github.io/zh/blog/qwen-tts/ 技术原理与数据基础 1. 大规模训练语料支撑 模型训练使用了超过 300 万小时的语音数据,包括中英文对齐数据以及丰富的方言语料,这使得模型不仅语音自然,而且能模仿不同地区的说话风格。 2. 韵律与情感建模 Qwen-TTS 支持自动调整文本的语速、
mzo

《硅谷》压缩技术好像现世了!!!将视频压缩 80~90% 几乎不损失效果?

炸裂! 《硅谷》压缩技术好像现世了!!!将视频压缩 80~90% 几乎不损失效果? 基于 FFMpeg 的 H264 压缩标准,实现压缩 90% 的视频大小 我自己上次了一个 60M+ 的视频,压缩之后 8.3MB,压缩 87%,效果看上去差不多... 原贴作者 @mortenjust ,目前帖子 100W+ 阅读了 https://x.com/tuturetom/status/1818468516045242792 我体验了一下... 确实离谱 ffmpeg -i input.mp4 -c:v libx264 -tag:v avc1 -movflags faststart -crf
mzo
Sora 提示词秘籍和竞品效果对比

Sora 提示词秘籍和竞品效果对比

2024 年 2 月 16 日凌晨,OpenAI 正式发布了文本到视频生成模型 Sora,直接生成 60s 视频,多角色多镜头切换的视频,还上了央视新闻。 目前 Sora 并未开放,只向少数导演艺术家开放邀请码。 至此,好莱坞的时代结束了,人人可以做视频电影的时代到来啦! 今天我们就 Sora 生成视频来拆解提示词秘籍公式,竞品视频生成效果对比,解析 Sora 优势劣势和 Sora 模型原理。 一、AIGC 视频模型效果对比 首先让我们看看,目前主流的 AI 视频工具 Runway、Pika、Stable Video Diffusion 与 Sora 基本参数对比。包括发布时间、特点风格、生成时长、每秒帧数和分辨率,如下图所示。
mzo
🎉 新功能:Sora 提示生成器

🎉 新功能:Sora 提示生成器

目录 此存储库的组织结构如下: *  技术 *  视频生成提示 *  图像动画提示 * 视频到视频编辑提示 *  图像生成提示  技术 使用简单自然的语言,我们可以生成所需的视频或图像。然而,掌握这仍然需要技巧。从灯光和风格到场景和角色,专业知识是必不可少的。该存储库旨在收集这些技术并给您带来灵感。 通过简单添加以下关键字,您可以有效地达到所需效果。 摄影技术/设备 35mm 镜头拍摄的电影  电影 35 毫米胶片 70 毫米制式拍摄的电影 用手机相机拍摄  风格化关键词  景深  特写镜头 这张照片清晰而锐利,景深较浅  鲜艳的颜色  电影的 3D 数字渲染艺术风格  视频生成提示 官方视频生成提示 点击查看更多示例 一位时尚的女士走在东京街头,灯光明亮、霓虹闪烁。她穿着一件黑色皮夹克,一条红色长裙,黑色靴子,还背着一只黑色手提包。她戴着墨镜,涂着红色口红。她步履自信、从容。
mzo