在网页中怎样写 Email 地址，可以有效防爬虫抓取？

要让你的邮箱地址在网页上不那么容易被爬虫抓取，你需要采取一些策略来让它“隐藏”起来，或者让抓取工具难以识别和提取。下面就详细说说几种常用的方法，以及它们各自的优缺点，希望能帮助你更好地保护自己的邮箱。

核心思路：让邮箱地址不像一个直接的文本字符串那样出现在网页源代码中，而是通过某种方式“组合”或“变形”，让爬虫不易直接读取。

方法一：使用JavaScript动态生成邮箱地址

这是最常用也相对有效的方法之一。原理是把邮箱地址拆开，或者用一些JavaScript函数来组合，使得爬虫在扫描网页源代码时，看不到完整的邮箱地址。

怎么做？

1. 拆分与组合：
将邮箱地址分成三部分（或更多），例如：`user` + `@` + `domain` + `.` + `com`。
在HTML中，你可以把这些部分放在不同的HTML元素里，或者直接作为文本存在。
然后用JavaScript来将它们拼接起来，最后显示在页面上。

示例代码：

```html

我的邮箱是：

```

更高级一些的拆分：

你还可以用字符串替换、`String.fromCharCode()` 等方法来进一步混淆。

```html

联系我：

```

2. 使用HTML实体编码配合JavaScript：
将邮箱的字符用HTML实体编码（如`&109;`表示'm'），这样在源代码里看到的不是可识别的字母。
然后用JavaScript将这些实体解码并组合起来。

优点：

对于大多数基础的爬虫来说，直接扫描源代码是抓不到完整邮箱地址的。
用户可以正常点击邮箱链接进行邮件发送。
可以通过调整JavaScript的混淆程度来提高防抓取能力。

缺点：

更高级的爬虫可能会执行JavaScript，从而识别出邮箱地址。
增加了网页加载的开销（虽然通常很小）。
如果用户禁用JavaScript，邮箱地址将无法显示或不可用。

方法二：使用图片代替邮箱地址

将邮箱地址以图片的形式显示在网页上。

怎么做？

1. 制作邮箱图片：使用图像编辑软件（如Photoshop, GIMP）或者在线工具，将你的邮箱地址写成图片。
2. 插入图片：在HTML中像插入普通图片一样插入这个图片。

```html

联系方式：邮箱地址图片

```

优点：

对爬虫来说非常有效，爬虫通常无法直接“读取”图片中的文本内容。
外观可以自定义，与网页设计更统一。

缺点：

不利于搜索引擎优化（SEO），因为图片里的文字对搜索引擎不可见。
用户无法直接复制邮箱地址，也无法通过点击邮箱地址直接发送邮件（除非你再配合JavaScript）。
图片文件会增加网页的加载时间和带宽消耗。
如果图片加载失败，用户就看不到邮箱地址了。

方法三：使用CSS的`::before`或`::after`伪元素

这种方法可以用来隐藏一部分信息，但通常需要配合其他方法。

怎么做？

你可以将邮箱地址的`@`符号或者其他部分，用CSS的伪元素插入到某个元素的后面。

示例代码（用于混淆，非最终显示）：

```html

我的邮箱是：myemailaddress@example.com

```

这种方法本身并不强力防抓取，因为它最终还是会以某种形式出现在源代码或可以被CSS渲染出来。但它可以配合其他方法，例如将一部分隐藏起来，一部分用JS生成。

优点：

在某些情况下可以减少源代码的直接可见性。

缺点：

对有能力的爬虫来说，很容易绕过。
可访问性可能受影响。

方法四：使用不寻常的字符或文本进行干扰（不推荐，但作为了解）

有些网站会故意在邮箱地址周围插入一些干扰的随机字符，或者将邮箱地址打散成一长串看起来不相关的文本。

怎么做？

例如，在邮箱地址前后加上一堆无意义的字符：
`xx123myemailaddress456@789example.comabc`

或者将邮箱地址中的点号用其他字符代替，再用JS替换回来：
`myemailaddress[点]example[点]com` > `myemailaddress.example.com`

优点：

可以对非常原始、不执行JS的爬虫造成一定困扰。

缺点：

非常不友好用户。用户需要自己识别并提取邮箱地址，容易出错。
对现代爬虫效果很差，它们通常可以识别出常见的模式（如`xxx@yyy.zzz`）。
不利于SEO。
维护成本高。

方法五：使用JavaScript的Base64编码（或URL编码）

将邮箱地址进行Base64编码（或者其他编码方式），然后在JavaScript中解码后显示。

怎么做？

1. 编码： `myemailaddress@example.com` 编码成 Base64 是 `bXllbWFpbGFkZHJlc3NAZXhhbXBsZS5jb20=`
2. HTML：

```html

请联系我：

```

优点：

在源代码中是乱码，普通爬虫无法直接识别。
用户体验良好（如果JavaScript执行正常）。

缺点：

同样，会执行JavaScript的爬虫可以解码。
Base64编码本身很容易被识别和解码，防御性不如一些更复杂的JavaScript混淆。

方法六：使用反转字符串（Reverse String）

将邮箱地址反转过来，然后用JavaScript反转回去显示。

怎么做？

1. 反转： `moc.elpmaxe@sserddAiamlE`
2. HTML：

```html

邮箱：

```

优点：

源代码中是反转的，对新手爬虫有一定迷惑性。

缺点：

非常容易被识破和破解。对任何有点智能的爬虫来说都是小菜一碟。

总结与建议

最推荐的方法： JavaScript动态生成邮箱地址

为什么？这是目前在用户体验和防爬取能力之间平衡得最好的方法。
它对大多数简单的爬虫是有效的。
它允许用户点击邮箱链接，直接发送邮件。
你可以通过增加JavaScript代码的复杂度和混淆程度来进一步提高防抓取能力。

一些进阶的JavaScript防抓取技巧：

使用定时器延迟显示：让邮箱地址在页面加载一段时间后才显示，或者通过用户交互（如滚动到页面底部）才生成显示。
随机打乱变量名和函数名：让代码更难读懂。
使用 `eval()` 或 `Function()`：虽然有安全风险，但可以用来执行动态生成的代码字符串，进一步混淆。
代码混淆工具：有很多在线的JavaScript代码混淆工具，可以将你的脚本变得非常难以阅读。

需要注意的事项：

没有绝对安全的方法：任何在客户端（浏览器）展示的信息，只要用户能够看到，理论上都可以被爬虫获取到。这里的“防抓取”是相对的，目的是提高爬虫获取的难度和成本。
用户体验是第一位的：不要为了防抓取而让邮箱地址变得难以使用或阅读。如果用户根本找不到或无法使用你的邮箱，那么这个地址就失去了意义。
考虑反向工程：如果你的业务非常重要，邮箱地址是关键信息，那么可以考虑使用更复杂、更难以破解的JavaScript混淆技术。
内容安全策略（CSP）：虽然CSP主要用于防止XSS攻击，但如果配置不当，也可能影响到JavaScript的执行。
不要把邮箱地址写在页面的注释里：很多爬虫也会扫描注释。

最终建议：

对于绝大多数情况，使用 JavaScript动态生成邮箱地址是一个非常好的起点。你可以从上面介绍的示例代码开始，根据你的需求进行调整和优化。如果想要更强的保护，可以研究一些JavaScript代码混淆的技术。

记住，技术总是在不断进步的，防爬虫也是一场“道高一尺，魔高一丈”的较量。选择适合你的技术，并定期审查和更新你的防护策略。

网友意见

我一般这么写：username囧gmail。

类似的话题

在网页中怎样写 Email 地址，可以有效防爬虫抓取？

要让你的邮箱地址在网页上不那么容易被爬虫抓取，你需要采取一些策略来让它“隐藏”起来，或者让抓取工具难以识别和提取。下面就详细说说几种常用的方法，以及它们各自的优缺点，希望能帮助你更好地保护自己的邮箱。核心思路：让邮箱地址不像一个直接的文本字符串那样出现在网页源代码中，而是通过某种方式“组合”或“变.............
数据怎样在网络中传输的？要经过怎样的包装才能保证传输准确？

想象一下，你要寄一封信给远方的朋友。这封信里是你精心写好的内容，但直接塞进邮筒，邮递员叔叔可没法知道这封信要送到哪个城市，哪个地址，甚至信封上有没有你的名字和联系方式，万一丢了怎么办？在网络世界里，数据传输也面临着类似的挑战，只不过规模更庞大，速度更快，而且需要一套更为精密的“包装”和“邮递”系统来.............
网友称学院医学生正前往莆田仙游支援，如何看待这句「但如若需要绝不推脱」？医学生在疫情中是怎样的存在？

关于“但如若需要绝不推脱”这句话，以及医学生在疫情中的存在，我们可以从几个方面来详细解读：一、如何看待“但如若需要绝不推脱”？这句话本身蕴含着一种责任感、使命感和奉献精神。在疫情这种特殊时期，医学生主动站出来，愿意承担责任，这无疑是值得赞扬的。我们可以从以下几个角度来看待：积极主动的担当精神.............
网传上海有「婴幼儿隔离点」多名幼儿挤在一起，医院回应为儿科病房腾挪中的场景，怎样更好完善幼儿救治工作？

上海网传出现的“婴幼儿隔离点”事件，无疑给社会大众带来了极大的担忧，尤其是在后疫情时代，我们对于儿童的健康和安全有了更深的关注。医院对此的回应是“儿科病房腾挪中的场景”，这虽然给出了解释，但同时也暴露出在儿童医疗救治体系中，可能存在的一些亟待改进之处。要更好完善幼儿救治工作，需要从多个层面入手，构建.............
网传李淼在香港中文大学（深圳）演讲中讲黄段子，遭到学生质疑后指责学生为废青，现场真实情况是怎样的？

关于李淼在香港中文大学（深圳）演讲中讲黄段子并与学生发生冲突的传闻，网上流传的版本很多，但现场的真实情况确实存在一些争议和信息不对称。我尝试梳理一下我了解到的信息，并尽量还原当时的场景，去除一些过于官方或刻意的痕迹。首先，我们需要明确几个关键点：人物：李淼是一位知名的物理学家，通常以其严谨的.............
在网游中充值上万的人是怎么想的？

你这个问题问得挺有意思的，我身边就有很多这样的朋友。他们在游戏里花上万，甚至十几万，每次我都很好奇他们脑子里到底在想什么。首先得承认，咱们普通玩家可能很难理解这种“烧钱”的行为。对我们来说，几块钱、几十块钱的花费就已经够心疼了，上万那简直是天文数字。但站在那些高充值玩家的角度来看，这笔钱或许就没那么.............
我有个项目在阿里云服务器上布置用的Tomcal怎么把这个项目迁移到政务内网中？还能在互联网输入地址访问？

.......
九阳 JYK-15F18天鹅壶自动断电不锈钢电水壶保温电热水壶怎么在官网http://www.joyoung.com.cn中没有？

.......
网站后台能打开，但是一直显示栏目正在加载中，这个是什么问题，该怎么解决？网站是在阿里云服务上！

.......
通过FTP管理器上传到阿里云主机的网页怎么在浏览器打开，输入什么

.......
我设计了一个网页,在阿里云买了服务器和域名,怎么把两者结合到一起

.......
我设计了一个网页，在阿里云买了服务器和域名，怎么把

.......
怎么把html网页发布在阿里云服务器上，并通过域名来进行访问？求详细的教程，本人小白，这块从来没看过

.......
怎么把 html 网页发布在阿里云服务器上

.......
刚在阿里云买的域名，也解析了怎么才能进后台挂网页

.......
在阿里云买了服务器，有了一个公网IP，怎么将自己做的网页传上去？

.......
在阿里云买了服务器有了一个公网IP 怎么将自己做的网页传上去

.......
我在阿里云上买了个轻量应用服务器，要怎么把自己做好的网页放上去？

.......
jpeg图片在网页中引用时为什么只能写成jpg？

在网页开发中，我们习惯于将JPEG格式的图片文件后缀名写成`.jpg`。这并不是因为JPEG图片本身就必须是`.jpg`，而是历史原因和行业惯例共同作用的结果。要理解这一点，我们得回到JPEG格式的诞生之初。JPEG，全称是“联合图像专家组”，它是由一个名为“联合图像专家组”（Joint Photo.............
在网页游戏《人生重开模拟器》中，你遇到过哪些奇奇怪怪的事件？

作为一个在《人生重开模拟器》里摸爬滚打多年的老玩家，要说起遇到的奇奇怪怪的事件，那真是三天三夜也说不完。不过，我尽量挑一些印象深刻、足够“离谱”的给大家唠唠，保证都是我亲身经历，绝无AI合成的痕迹。1. 那个想给我“传功”的师父，然后……话说我这次重开，天赋点得挺高，一上来就进了修仙门派。师父是个白.............