Site logo

漂流纸船实验室

MetaThief 一个快速获取网址 meta 信息的工具

MetaThief 一个快速获取网址 meta 信息的工具

开源项目
SEOMetadataAPIDeveloper

只需要输入一个链接,就能够快速获取网站的所有元信息,同时还支持通过 API 访问。

这是什么?

MetaThief 是一个快速获取网站 meta 信息的工具。只需输入网址,即可提取所有元数据,同时提供 API

为什么写这个?

有时候我会收集一些网站,然后把这些网站整理成类似导航站一样的页面,方便自己查看和管理。但是有个问题是,我需要手动从每个网站的源代码中查找 meta 信息,这既费时又费力。

刚好,在我刚刚接触 SEO 时,也了解到这些元信息还能用于优化搜索引擎的排名,所以这也给了我完成这个工具的动力。于是我就开始写这个工具,一开始只有最简单的功能,比如提取基础元数据和 Open Graph 标签。随着我使用这个工具的次数越来越多,我也增加更多功能,比如提取图标、robots.txt 等信息。

核心功能

  • 元数据获取 - 支持基础元数据和 Open Graph 标签
  • 图标提取 - 获取网站 favicon、icons 等多尺寸图标
  • robots.txt 抓取 - 一键获取站点爬虫规则
  • API 支持 - 提供 RESTful API,方便程序调用

支持的元标签

类别标签
基础language, charset, viewport, title, description, keywords, author, generator
链接favicon, canonical, icons, theme
Open GraphogUrl, ogTitle, ogSiteName, ogDescription, ogImage, ogImageAlt, ogType
TwittertwitterSite, twitterCard, twitterTitle, twitterCreator, twitterDescription, twitterImage
其他robots

解决什么问题?

整理导航站、分析竞品网站、SEO 优化时,手动从源代码中查找 meta 信息效率低下。MetaThief 自动提取所有元数据,省时省力。

API 使用

获取所有元数据:

GET /api/meta?url=https://example.com

获取特定元标签:

GET /api/meta?url=https://example.com&meta=title,description,favicon

响应示例:

{
  "title": "Example Website",
  "description": "Website description",
  "favicon": "https://example.com/favicon.ico",
  "icons": [
    "https://example.com/favicon.ico",
    "https://example.com/apple-touch-icon.png"
  ]
}