【JS实现】在调试台爬网页内容

问题产生于,在看小说的时候有些章节想单独保存下来,然而多数的小说网站都禁止复制粘贴功能,如长佩、废文等,这个时候用JS在控制台爬文本就比较简单了,可以把文本保存为txt下载,但是这样的缺点就是需要手动打开每章去控制台操作,如果几百章几千章就累死了……还是python爬虫处理方便些,不过多数网站也都有防爬机制,就酱

//以长佩为例
var cpNode = document.getElementById("cpReadContent").getElementsByTagName("p");
var str = '';
for(let i = 0; i < cpNode.length; i++){
    if(cpNode[i].className == "cp-hidden") continue;
   str += (cpNode[i].innerText + "
");
}

function download(filename, text) {
  var element = document.createElement('a');
  element.setAttribute('href', 'data:text/plain;charset=utf-8,' + encodeURIComponent(text));
  element.setAttribute('download', filename);
 
  element.style.display = 'none';
  document.body.appendChild(element);
 
  element.click();
 
  document.body.removeChild(element);
}
 
 
download("test.txt",str);

  

原文地址:https://www.cnblogs.com/JesseyWang/p/12937200.html