大家是否还记得 2012 年,Linux 之父 Linus Torvalds 在一次活动中“愤怒”地表达了对英伟达闭源 Linux GPU 驱动的不满?这个场景曾是热门表情包,程序员人手一个。
Linux 开发者们苦此久已,十年后(2022),英伟达终于向开源迈出了第一步,开源了 Linux GPU 内核驱动(R515),尽管这未必与 Linus 的批评直接相关🤷,但却标志着英伟达对于开源的转变。如今两年过去了,英伟达再次向开源迈出重要一步,宣布“全面转向开源 GPU 内核模块”,将在即将发布的 R560 驱动版本中采用开源内核取代闭源驱动,这一行为“利好”开发者:
不过,对于普通 Linux 使用来说,要在 Linux 上玩 3A 游戏巨作,还为时尚早...
说回本周的开源热搜项目,写爬虫最怕被“认”出来,这款更像人类行为的爬虫框架 Crawlee 即使默认配置下也不会轻易被识别。谁说 Linux 上没有“时尚”的软件?Foliate 让你在 Linux 上优雅地阅读电子书。Meta 新开源的 CV 和 AR 应用开发 C++ 框架 Ocean,它独立于平台支持在各种系统上开发 AR 应用。
最后,更容易上手的终端复用器 Zellij 和更简单的 Go WebSocket 库,更是不容错过。
1. 开源热搜项目
主语言:Python,Star:3.1k,周增长:2.5k
这是一个网页抓取和浏览器自动化库,特点是用它写的爬虫也不容易被识别出来(封/ban)。它提供了强大的代理池功能,可以根据实际流量自动切换和移除失效的 IP,支持无头浏览器、模拟浏览器和 TLS 指纹等爬取行为,以及 JavaScript 渲染、屏幕截图和 Puppeteer 等浏览器自动化功能。
最初开源的 crawlee NPM 包 Star 早已破万,新开源的 Python 库更是一周突破了 3k Star。
import asyncio
from crawlee.beautifulsoup_crawler import BeautifulSoupCrawler, BeautifulSoupCrawlingContext
async def main() -> None:
crawler = BeautifulSoupCrawler(
max_requests_per_crawl=10,
)
@crawler.router.default_handler
async def request_handler(context: BeautifulSoupCrawlingContext) -> None:
context.log.info(f'Processing {context.request.url} ...')
await context.enqueue_links()
await crawler.run(['hellogithub.com'])
if __name__ == '__main__':
asyncio.run(main())
Python→github.com/apify/crawlee-python
JavaScript→github.com/apify/crawlee
主语言:JavaScript,Star:5.6k,周增长:300
这是一款免费、开源、适用于 Linux 的电子书阅读工具,它提供了简洁的界面和极佳的阅读体验,使用起来很像 Kindle 阅读器,支持划词翻译、添加书签和注释和进度滑块,以及调整字体、间距、边距和配色等功能,支持 EPUB、Kindle 和 PDF 等多种格式的文件。
GitHub 地址→github.com/johnfactotum/foliate
主语言:Rust,Star:445,周增长:400
这是一个处理时间和日期的 Rust 库,特别适合处理令人头疼的时区和夏令时的场景。它提供了简单易用的 API 和强大的时区支持,支持自动处理时区转换、夏令时调整和无损地格式化和解析日期时间。该项目是知名的正则表达式工具 rg(ripgrep)作者的又一新作,目前还处于开发阶段,生产环境慎用。
use jiff::{Timestamp, ToSpan};
fn main() -> Result<(), jiff::Error> {
let time: Timestamp = "2024-07-11T01:14:00Z".parse()?;
let zoned = time.intz("America/New_York")?.checked_add(1.month().hours(2))?;
assert_eq!(zoned.to_string(), "2024-08-10T23:14:00-04:00[America/New_York]");
// Or, if you want an RFC3339 formatted string:
assert_eq!(zoned.timestamp().to_string(), "2024-08-11T03:14:00Z");
Ok(())
}
GitHub 地址→github.com/BurntSushi/jiff
主语言:C,Star:14.6k,周增长:400
该项目是英伟达(Nvidia)开源的 Linux GPU 内核驱动,本次更新标志着英伟达又向开源迈出了重要一步,宣布全面拥抱开源,后续 GPU 驱动将采用开源内核(之前是闭源),本次更新提供了更可靠、功能齐全的 GeForce 和工作站 Linux GPU 支持,并新增了异构内存管理(HMM)、机密计算和 Grace 平台的连贯内存架构等功能。
GitHub 地址→github.com/NVIDIA/open-gpu-kernel-modules
主语言:C++,Star:439,周增长:400
该项目是 Meta(原 Facebook)开源的一个用于开发计算机视觉(CV)和增强现实(VR)应用的 C++ 框架,它是一个独立于平台的开发框架,支持开发 iOS、Android、Quest、macOS、Windows 和 Linux 平台上的应用。
#include "ocean/base/Frame.h"
using namespace Ocean;
FrameType frameType(1280u, 720u, FrameType::FORMAT_RGB24, FrameType::ORIGIN_UPPER_LEFT);
Frame frameOwningTheMemory(frameType);
GitHub 地址→github.com/facebookresearch/ocean
在这个章节,将会分享下本周 HelloGitHub 网站上的热门开源项目,欢迎与我们分享你上手这些开源项目后的使用体验。
主语言:Go
该项目是用 Go 编写的 WebSocket 库,它提供了简洁明了的 API,具备高吞吐、低延迟、低内存占用、稳定可靠的特点,可用于高并发场景,支持上下文接管、自定义窗口大小和广播等功能。
项目详情→hellogithub.com/repository/268cee8eb54b4a7189d38fb12f165177
主语言:Rust
该项目是一个 Rust 写的终端多路复用器,支持单窗口多标签、分割窗口和自动恢复连接等功能。它提供了开箱即用的默认配置,同时拥有强大的插件系统,从而深受初学者和高级用户的喜爱。
项目详情→hellogithub.com/repository/b3adbf4f52f94d578f1c48aafb742f05
以上就是本期「GitHub 热点速览」的全部内容,希望你能够在这里找到自己感兴趣的开源项目,如果你有其他好玩、有趣的 GitHub 开源项目想要分享,欢迎来 HelloGitHub 与我们交流和讨论。
往期回顾
- END -
👆 关注「HelloGitHub」第一时间收到更新👆