设为首页 | 加入收藏
您当前位置:主页 > www.t17yc.cc > 各位大神现在我有一项任务是在一份pdf(杂志)中剔除内页中的那些

各位大神现在我有一项任务是在一份pdf(杂志)中剔除内页中的那些

时间:2019-10-20 02:14 来源:未知   点击:

  各位大神,现在我有一项任务是在一份pdf(杂志)中剔除内页中的那些广告,该怎样用python实现?

  各位大神,现在我有一项任务是在一份pdf(杂志)中剔除内页中的那些广告,该怎样用python实现?

  各位大神,现在我有一项任务是在一份pdf(杂志)中剔除内页中的那些广告,该怎样用python实现?具体是这样,1.内页里的那些广告字很少,多为图片,内容页多为单词(英文杂志),2.我希望程...

  各位大神,现在我有一项任务是在一份pdf(杂志)中剔除内页中的那些广告,该怎样用python实现?具体是这样,

  现在我知道至少需要pyPDF包,而识别算法该如何去学习,本人新手,但真的很想知道该如何自己去解决,请大神不要吝啬指导展开我来答

  可选中1个或多个下面的关键词,搜索相关资料。也可直接点“搜索资料”搜索整个问题。

  最理想状况下,假设广告全是矩形图片,可以将pdf转为灰度图片,然后利用边缘微分算子找出矩形,然后原图片将矩形区域涂白,再写入pdf。如果有其他非广告矩形区域,就会误伤。如果广告图片背景也是白色,则失灵。如果你的pdf非扫描,也许可以直接读取文字(不了解pyPDF),就可以过滤掉图片,不过要重新排版。总之比较麻烦,如果量少,也许手动更快写。我国现任全国政协主席是谁