Python批量翻译Google技巧：绕过Token生成

111 浏览量更新于2024-08-28 1 收藏 76KB PDF 举报

"这篇资源主要介绍了如何使用Python实现Google批量翻译功能，重点在于解析和生成Google翻译所需的Token，以及避免使用PyExecJS库，而是直接将JavaScript代码转换为Python实现。作者提到了TkK值的动态获取和翻译过程中涉及到的编码处理。" 在Python实现Google批量翻译时，首要任务是解决Google为了防止爬虫而设置的Token生成问题。这个Token是由JavaScript动态生成的，基于网站的TKK值和提交的文本。由于TKK的更新规律未知，因此需要定期获取。Python中通常有两种方法来处理这种情况： 1. 使用第三方库PyExecJS：这种方法会通过JavaScript引擎运行原始的JavaScript代码来获取Token。然而，这种方式可能效率较低，并且对于一些开发者来说不够“纯粹”。 2. 直接将JavaScript代码转化为Python：这是一种更直接的方法，虽然需要对JavaScript代码进行理解和转换，但可以避免调用外部库，提高执行效率。资源中提到的Python代码就是采用了这种方式，将原始的JavaScript函数转换为Python函数，以便在Python环境中执行。原始的JavaScript代码涉及到了位操作和字符编码处理，用于计算Token。例如，`b`函数使用了位移和异或操作，而`tk`函数则处理了Unicode字符编码，确保输入字符串被正确地分块和编码，以便于计算。在Python版本中，这些操作需要被适当地映射到Python的位运算符和字符串处理函数。在实际应用中，Python代码会先获取TKK值（通常是两个数字用点号分隔的形式），然后对输入文本进行分块和编码，接着利用转换后的Python函数计算Token。一旦得到了正确的Token，就可以构造出模拟网页提交的请求，批量翻译文本。批量翻译的实现通常包括以下步骤： 1. 获取TKK值：定期从Google翻译页面抓取或使用网络请求获取。 2. 对输入文本进行预处理：根据需要进行编码转换和分块。 3. 计算Token：使用转换后的Python代码，将预处理后的文本和TKK值作为输入。 4. 构建请求：创建HTTP请求，包含翻译的源语言、目标语言、文本和计算出的Token。 5. 发送请求：使用如requests库发送HTTP请求到Google翻译API。 6. 解析响应：接收到翻译结果后，解析JSON或其他格式的响应，提取翻译内容。这个资源提供了一个自给自足的Python解决方案，用于批量翻译，绕过了可能存在的API费用，并且避免了依赖外部库。对于Python开发者来说，这是一个学习如何与Web服务交互和理解JavaScript到Python转换的好例子。

Python 实现的实现的 Google 批量翻译功能批量翻译功能

首先声明，没有什么不良动机，因为经常会用 translate.google.cn，就想着用 Python 模拟网页提交实现文档的批量翻译。据

说有 API，可是要收费。

生成生成 Token

Google 为防爬虫而生成 token 的代码是 Javascript 的，且是根据网站的 TKK 值和提交的文本动态生成。更新规律未知，只好

定时去取一下了。

网上能找到的 Python 代码大部分是去调用 PyExecJS 库，先不说执行效率的高低（大概是差一个数量级），首先是舍近求

远，不纯粹，本人不喜欢。

好不容易找到了一段 Python 代码还有点小 Bug，且缺少动态获取 TKK 的步骤。最后还是对照 Javascript 代码自己改成

Python 了。方法很简单，先转成易懂的 Javascript，再转成 Python。Javascript 代码来自C#实现谷歌翻译API。

原始（晦涩）原始（晦涩） Javascript 代码代码

var b = function (a, b) {

for (var d = 0; d < b.length - 2; d += 3) {

var c = b.charAt(d + 2),

c = "a" <= c ? c.charCodeAt(0) - 87 : Number(c),

c = "+" == b.charAt(d + 1) ? a >>> c : a << c;

a = "+" == b.charAt(d) ? a + c & 4294967295 : a ^ c

}

return a

}

var tk = function (a,TKK) {

for (var e = TKK.split("."), h = Number(e[0]) || 0, g = [], d = 0, f = 0; f < a.length; f++) {

var c = a.charCodeAt(f);

128 > c ? g[d++] = c : (2048 > c ? g[d++] = c >> 6 | 192 : (55296 == (c & 64512) && f + 1 < a.length && 56320 == (a.charCodeAt(f + 1) & 64512) ? (c =

65536 + ((c & 1023) << 10) + (a.charCodeAt(++f) & 1023), g[d++] = c >> 18 | 240, g[d++] = c >> 12 & 63 | 128) : g[d++] = c >> 12 | 224, g[d++] = c >> 6 &

63 | 128), g[d++] = c & 63 | 128)

}

a = h;

for (d = 0; d < g.length; d++) a += g[d], a = b(a, "+-a^+6");

a = b(a, "+-3^+b+-f");

a ^= Number(e[1]) || 0;

0 > a && (a = (a & 2147483647) + 2147483648);

a %= 1E6;

return a.toString() + "." + (a ^ h)

}

易懂的易懂的 Javascript 代码代码

function RL(a, b) {

for (var d = 0; d < b.length - 2; d += 3) {

var c = b.charAt(d + 2);

c = "a" <= c ? c.charCodeAt(0) - 87 : Number(c);

c = "+" == b.charAt(d + 1) ? a >>> c : a << c;

a = "+" == b.charAt(d) ? a + c & 4294967295 : a ^ c;

}

return a

}

function TL(a,TKK) {

var e = TKK.split(".");

var h = Number(e[0]) || 0;

var g = [];

var d = 0;

for (var f = 0; f < a.length; f++) {

var c = a.charCodeAt(f);

if (128 > c)

{

g[d++] = c;

}

else

{

if (2048 > c)

{

g[d++] = c >> 6 | 192;

}

else

{

if (55296 == (c & 64512) && f + 1 < a.length && 56320 == (a.charCodeAt(f + 1) & 64512))

{

c = 65536 + ((c & 1023) << 10) + (a.charCodeAt(++f) & 1023);

下载后可阅读完整内容，剩余4页未读，立即下载

weixin_38650951

粉丝: 5
资源: 927

Python批量翻译Google技巧：绕过Token生成

python3读取翻译Excel后写入新Excel

python英文单词批量抽取美式英标英式音标中文解释例句解释

python批量将excel内容进行翻译写入功能

Python批量翻译Google技术实现解析

批量翻译利器：Python实现360与Google在线翻译函数

艺术与代码结合：Python实现图像风格迁移指南

Selenium与Python结合实现网页自动化测试

Xshell中如何利用脚本实现批量操作

"NSDPY：一个灵活易用的Python软件包，用于批量下载NCBI的DNA序列

Python实践：手把手教你实现高效的反向传播算法

最新资源