每日Github探索:9款值得关注的开源项目

1. microsoft/MS-DOS

这个 GitHub 仓库(microsoft/MS-DOS)包含 MS-DOS v1.25、v2.0 和 v4.0 的原始源代码。MS-DOS 是由微软开发的早期个人电脑操作系统。

v1.25 和 v2.0 文件最初于 2014 年 3 月 25 日在计算机历史博物馆分享,现已在这个仓库重新发布,以便于查找、参考和探索。v4.00 的源代码是由 IBM 和微软联合开发的。

所有文件均根据 MIT 许可证发布,源文件仅供历史参考,保持不变。请勿提交修改源文件的请求,但欢迎分叉此仓库并进行实验。此项目采用了微软开源行为准则。

此项目可能包含商标或徽标,必须遵循微软的商标和品牌准则。在修改的项目版本中使用微软商标或徽标不得引起混淆或暗示微软赞助。使用第三方商标或徽标须遵守这些第三方的政策。

2. myshell-ai/OpenVoice

OpenVoice是一款来自MyShell的即时语音克隆工具,适用于多种语言和口音。它不仅可以准确克隆说话人的音色,还能灵活控制语音风格(如情绪、节奏、语调)。此外,OpenVoice还支持零样本跨语言语音克隆,即使克隆语音与参考语音语言不同,也能生成高质量语音。

2024年4月,OpenVoice发布了V2版本,在V1的基础上进行了多项改进。V2拥有更好的音频质量,并原生支持英语、西班牙语、法语、中文、日语和韩语。更重要的是,V2和V1均已获得MIT许可,可免费用于商业用途。

自2023年5月起,OpenVoice已被MyShell用于为用户提供即时语音克隆功能。截至2023年11月,该模型已在全球范围内被使用数千万次,见证了平台上的用户激增。

OpenVoice拥有一个活跃的开发者社区,用户可以在Discord社区中加入“开发者”角色,参与讨论和协作。

3. apple/corenet

CoreNet是一个深度神经网络工具包,研究人员和工程师可以使用它来训练针对各种任务的标准和新型的小规模和大型模型,包括基础模型(如CLIP和LLM)、对象分类、对象检测和语义分割。

CoreNet提供了一个简便的界面,允许用户轻松配置和启动训练作业,而无需深入了解底层实现的复杂性。此外,它还包含广泛的预训练模型、培训食谱和示例,使研究人员能够在最先进的技术基础上快速入门。

通过利用编目模型、损失函数、优化器和工具等一系列组件,CoreNet促进了模块化、可扩展的模型开发。它还支持各种数据集,并提供了灵活的自定义和扩展选项,使研究人员能够针对特定任务定制训练管道。

作为CVNets项目的后继者,CoreNet扩展了其范围,涵盖了更广泛的应用,包括自然语言处理和多模态训练。它与CVNets保持着密切的关系,从中继承了基础技术和最佳实践。

总而言之,CoreNet是一个功能强大且用户友好的深度神经网络工具包,使研究人员能够高效地训练和部署各种任务的先进模型。

4. binary-husky/gpt_academic

GPT学术优化

本项目基于 GPT/GLM 等大语言模型提供实用化的交互界面,特别针对论文阅读、润色、写作体验优化。

特性

  • 可自定义快捷按钮和函数插件
  • 支持 Python 和 C++ 等语言项目分析和自我解析
  • PDF/LaTeX 论文翻译和摘要功能
  • 支持多语言问询和本地模型

支持模型

  • ChatGPT
  • GLM
  • DeepseekCoder
  • 文心一言
  • LLaMa2
  • RWKV
  • Claude2
  • MOSS

功能

  • 润色、翻译、代码解释
  • 程序剖析、自我剖析
  • 读论文、翻译论文
  • LaTeX 全文翻译、润色
  • Markdown 中英互译
  • PDF 论文全文翻译
  • Arxiv 小助手
  • Google 学术统合小助手
  • 互联网信息聚合 + GPT
  • 多 LLM 模型支持

安装

可使用以下方法安装:

  • 直接运行: pip install -r requirements.txt
  • Docker:
    • 全部能力大镜像:docker-compose up
    • 基本在线模型镜像:docker-compose up (保留方案 1)
    • LaTeX 在线模型镜像:docker-compose up (保留方案 1)

高级用法

  • **自定义快捷按钮:**修改 core_functional.py 文件。
  • **自定义函数插件:**创建插件文件并按照指南编写代码。

更新

  • 实时语音对话支持
  • LaTeX/Arxiv 论文翻译功能
  • 虚空终端(自然语言输入控制其他插件)
  • 模块化功能设计
  • 其他开源项目解析

支持和交流

5. TagStudioDev/TagStudio

TagStudio是一款专注于用户的文件管理系统,提供无须专用程序、侧边文件和文件系统结构费解改动的便捷性。其特点包括:

  • **文件、照片管理:**创建包含目录系统的文件库,其中包含文件的呈现形式及其元数据字段,与库目录中的文件和位置相连接。

  • **丰富的元数据:**为文件库添加以下元数据:

    • 名称、作者、艺术家(单行文本字段)
    • 描述、备注(多行文本字段)
    • 标签、元标签、内容标签(标签框)
  • **可组成的标签:**创建包含名称、别名列表和“子标签”列表的复合标签,子标签会继承父标签的值。

  • **基于标签、元数据和文件名搜索:**使用 filename: <query> 搜索文件。

  • **特殊搜索条件:**搜索未加标签或空字段的文件。

该系统遵循以下优先级:

  1. **概念:**即使 TagStudio 作为项目或应用程序失败,其背后的核心思想也可以继续存在。
  2. **系统:**核心元数据管理系统应在不同前端、程序和操作系统之间具有互操作性。
  3. **应用程序:**TagStudio 是该元数据管理系统的第一个也是目前唯一实现。
  4. **名称:**应用程序名称可能会随着时间的推移而演变。

目前,TagStudio 处于 Alpha 阶段,具有以下特性:

  • 创建以系统目录为中心的库/金库。
  • 为库条目添加元数据,包括名称、作者、艺术家、描述、备注、标签和元标签。
  • 创建包含名称、别名和子标签的丰富标签。
  • 根据标签、元数据或文件名搜索条目。
  • 针对未加标签/没有标签和空/没有字段的条目设定特殊搜索条件。

TagStudio 还在计划添加以下功能:

  • 优先功能:改进搜索、标签管理视图、多选元数据应用、基于系统文件夹应用标签、更好的库网格视图、改进的条目重新链接、缩略图缓存、集合、可调整大小的缩略图网格、用户定义元数据字段、多个目录支持、SQLite(或类似)保存文件、读取 EXIF 和 XMP 字段、改进的 UI/UX 等。

  • 未来功能:支持多个同时用户/客户端、可拖拽文件、忽略特定文件、完善的“宏系统”、不同的库视图、日期和时间字段、条目链接/引用、音频波形预览、3D 对象预览、各种文件类型的附加预览、可导出/可共享标签和设置、可选的全局标签和设置、跨库导入/导出库、更快速的语言和现代前端移植、插件系统、本地 OCR 搜索、图像本地机器学习标签建议支持、移动版本等。

6. hydralauncher/hydra

Hydra是一款功能强大的游戏启动器,它拥有嵌入式比特洪流客户端和自律性重打包抓取器。该启动器采用TypeScript(Electron)和Python编写,使用libtorrent处理BT系统。

Hydra利用SteamGridDB API获取游戏图标,支持onlinefix作为重打包工具,需在.env文件中配置凭据。要运行Hydra,需要安装Node.js、Yarn、Python 3.9并配置环境变量。运行以下命令启动:yarn start

Hydra允许构建比特洪流客户端和Electron应用程序。要构建客户端,请输入python torrent-client/setup.py build。要构建Electron应用程序,请输入yarn make

Hydra项目由多位贡献者共同完成。感谢以下人员的付出:Hydra、Null、Fhilipe Coelho、Magrid、FeriVOQ、Guilherme Viana、João Martins、Ikko Eltociear Ashimine、Netflixy。

Hydra遵循MIT许可协议,开放源代码,欢迎使用和修改。

7. zyronon/douyin

douyin-vue 是一个模仿抖音的移动端短视频应用,采用了最新的 Vue 技术栈,包括 Vue3、Vite5 和 Pinia。它提供了一种媲美原生 App 的流畅使用体验

该项目使用本地数据,通过拦截 API 返回模拟的 JSON 数据,以模拟真实的后端请求。数据来自抖音网红和互联网公开资料。

douyin-vue 具有以下功能:

  • 视频无限滑动
  • 路由转场动画
  • 基于Swiper.js的轮播组件
  • 遵循移动端最佳实践

该项目处于开发初期,正在持续添加新功能。如果您有任何建议或想贡献,欢迎提出意见。您可以通过电子邮件联系开发者或查看其他开源项目,如 Typing Word 和 Web Scripts。

douyin-vue 采用 GNU 通用公共许可证 v3.0,是一个开源项目,欢迎任何人使用、修改和分享。

8. chat2db/Chat2DB

Chat2DB 是一款功能强大的通用 SQL 客户端和数据库报告工具,集成了 ChatGPT 的强大功能。它具备以下特点:

  • AI 驱动的智能 SQL 开发,提供类似 ChatGPT 的提示式交互,协助用户编写复杂的 SQL 查询。
  • AI 驱动的智能报告,自动生成数据可视化和分析报告,简化数据洞察的过程。
  • AI 驱动的数据探索,通过自然语言理解,帮助用户深入探索数据,发现隐藏的模式和趋势。
  • 支持广泛的数据库,包括 MySQL、PostgreSQL、Oracle、SQL Server 等,满足不同用户的需求。

Chat2DB Pro 版增加了以下高级功能:

  • AI 驱动的智能 SQL 开发,提供更全面的提示支持,提升 SQL 开发效率。
  • AI 驱动的智能报告,支持自定义报告模板,灵活生成所需报告格式。
  • AI 驱动的数据探索,提供更深层次的数据洞察,帮助用户快速了解数据。

目前,Chat2DB 已获取超过 100 万开发者的青睐,并开源了其第一个通用语言模型——Chat2DB-SQL-7B。该模型可在 GitHub、Hugging Face 和 ModelScope 等平台获取。

此外,Chat2DB 欢迎社区贡献者加入其项目。通过报告问题、提出新功能或直接提交代码修正和改进,用户可以为 Chat2DB 的发展做出贡献。

9. Doriandarko/maestro

Maestro 是一款 Python 脚本,使用 Anthropic API 实现了人工智能辅助的任务分解和执行工作流程。它利用两个 AI 模型 Opus 和 Haiku 来将目标分解为子任务,执行每个子任务,并将结果细化为一个有凝聚力的最终输出。

Maestro 的主要功能包括:

  • 使用 Opus 模型将目标分解为可管理的子任务
  • 使用 Haiku 模型执行每个子任务
  • 为 Haiku 模型提供先前子任务的记忆作为上下文
  • 使用 Opus 模型将子任务结果细化为最终输出
  • 生成详细的交换日志,记录整个任务分解和执行过程
  • 将交换日志保存到 Markdown 文件以方便参考
  • 优化 Opus 模型的提示以更好地评估任务完成度
  • 在处理代码项目时创建代码文件和文件夹

此脚本需要 Python、Anthropic API 密钥和必需的 Python 包,包括 anthropicrich。要使用此脚本,请替换脚本中的占位符 API 密钥,输入目标,并按照提示运行脚本。

Maestro 根据需要可定制,包括调整最大令牌数、更改模型、修改控制台输出格式以及自定义交换日志格式。它遵循 MIT 许可协议,并感谢 Anthropic 和 Rich 的支持。

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容