
MetaThief 一个快速获取网址 meta 信息的工具
开源项目
SEOMetadataAPIDeveloper
只需要输入一个链接,就能够快速获取网站的所有元信息,同时还支持通过 API 访问。
这是什么?
MetaThief 是一个快速获取网站 meta 信息的工具。只需输入网址,即可提取所有元数据,同时提供 API
为什么写这个?
有时候我会收集一些网站,然后把这些网站整理成类似导航站一样的页面,方便自己查看和管理。但是有个问题是,我需要手动从每个网站的源代码中查找 meta 信息,这既费时又费力。
刚好,在我刚刚接触 SEO 时,也了解到这些元信息还能用于优化搜索引擎的排名,所以这也给了我完成这个工具的动力。于是我就开始写这个工具,一开始只有最简单的功能,比如提取基础元数据和 Open Graph 标签。随着我使用这个工具的次数越来越多,我也增加更多功能,比如提取图标、robots.txt 等信息。
核心功能
- 元数据获取 - 支持基础元数据和 Open Graph 标签
- 图标提取 - 获取网站 favicon、icons 等多尺寸图标
- robots.txt 抓取 - 一键获取站点爬虫规则
- API 支持 - 提供 RESTful API,方便程序调用
支持的元标签
| 类别 | 标签 |
|---|---|
| 基础 | language, charset, viewport, title, description, keywords, author, generator |
| 链接 | favicon, canonical, icons, theme |
| Open Graph | ogUrl, ogTitle, ogSiteName, ogDescription, ogImage, ogImageAlt, ogType |
| twitterSite, twitterCard, twitterTitle, twitterCreator, twitterDescription, twitterImage | |
| 其他 | robots |
解决什么问题?
整理导航站、分析竞品网站、SEO 优化时,手动从源代码中查找 meta 信息效率低下。MetaThief 自动提取所有元数据,省时省力。
API 使用
获取所有元数据:
GET /api/meta?url=https://example.com
获取特定元标签:
GET /api/meta?url=https://example.com&meta=title,description,favicon
响应示例:
{
"title": "Example Website",
"description": "Website description",
"favicon": "https://example.com/favicon.ico",
"icons": [
"https://example.com/favicon.ico",
"https://example.com/apple-touch-icon.png"
]
}