在软件的不断升级和更新下,最新版的抖音评论抓取和视频下载做完了。
这次的版本更改了界面将会更直观的展现出来,主要的功能有关键词批量视频、博主视频监控和获取、单个视频获取和监控。
抓取的评论内容有 评论昵称,评论日期,评论内容,命中关键词,评论的哪个视频的名称。
一:概述
1. 此次更新的版本是用于建立抓取任务、输入关键词、评论监控词和视频下载进行抓取;
2. 抓取是通过云端算力进行抓取并非客户端的电脑抓取;
3. 当用户在确认开始后可选择关闭电脑和程序,云端算力来抓取。当下次打开程序后可以观看历史记录浏览相关内容;
4. 数据都是实时抓取和实时更新的。

二:解析内容源码
1. 这段源码给出的是视频批量下载所用到的解析
(注:不同的视频地址解析方法不一样,这里给出的是经过我们在使用过程中分析出来的)
视频名称对应的解析标签和源码这里使用的是:正则表达式
string title_b = "";
// 使用正则表达式提取 content 属性的值
string pattern = @"<meta\s+name=""lark:url:video_title""\s+content=""([^""]+)""";
Match match = Regex.Match(html, pattern);
if (match.Success)
{
// 获取匹配到的 content 属性值
string contentValue = match.Groups[1].Value;
title_b = contentValue;
if (title_b.Trim() == "抖音-记录美好生活")
{
title_b = "";
}
Console.WriteLine("Content Value: " + contentValue);
}
else
{
Console.WriteLine("No meta tag found or content attribute not present.");
}
2. 视频下载地址标签和源码
public string mp4_ceng(string html)
{
string mp4_url = "";
string input = html;
string srcValue = GetSrcFromSourceTag(input);
mp4_url = srcValue;
return mp4_url;
}
static string GetSrcFromSourceTag(string input)
{
Regex regex = new Regex(@"<source[^>]+src\s*=\s*""([^""]+)""");
Match match = regex.Match(input);
if (match.Success)
{
return match.Groups[1].Value;
}
else
{
return null; // 或者抛出异常,视情况而定
}
}
三:界面展示及功能介绍
1. 关键词批量视频
1.1添加任务:输入任务名称,名称可以是此次任务的概括方便记录和查找;搜索词:自己想要搜索视频的关键词语;评论监控词:监控词可以是一个或多个(注:当输入多个监控词时,每个监控词之间要用英文输入法的逗号隔开)最后保存任务开始抓取数据。
1.2监控、历史任务:任务列表显示的是实时抓取到的数据有任务名称,搜索词,视频数量,评论数量,命中数量;
1.3未命中评论:未命中报表是指搜索的视频中评论不包含命中词的评论。
内容包括:评论人,评论视频名称,视频作者,评论地区,评论内容,评论时间,批次号
已命中评论:已命中报表的解释:评论中包含,任务中设置的有效命中词在此列表显示
内容包括:评论人,评论视频名称,视频作者,评论地区,评论内容,评论时间,命中词,批次号
1.4点击查看详细
点击列表中的评论内容显示评论详情窗口,可以查看评论的详细内容
详细内容包括:评论人,评论日期,评论视频,视频作者,视频地址,作者地址,评论人地址,评论内容,评论人二维码
这次的版本更改了界面将会更直观的展现出来,主要的功能有关键词批量视频、博主视频监控和获取、单个视频获取和监控。
抓取的评论内容有 评论昵称,评论日期,评论内容,命中关键词,评论的哪个视频的名称。
一:概述
1. 此次更新的版本是用于建立抓取任务、输入关键词、评论监控词和视频下载进行抓取;
2. 抓取是通过云端算力进行抓取并非客户端的电脑抓取;
3. 当用户在确认开始后可选择关闭电脑和程序,云端算力来抓取。当下次打开程序后可以观看历史记录浏览相关内容;
4. 数据都是实时抓取和实时更新的。

二:解析内容源码
1. 这段源码给出的是视频批量下载所用到的解析
(注:不同的视频地址解析方法不一样,这里给出的是经过我们在使用过程中分析出来的)
视频名称对应的解析标签和源码这里使用的是:正则表达式
string title_b = "";
// 使用正则表达式提取 content 属性的值
string pattern = @"<meta\s+name=""lark:url:video_title""\s+content=""([^""]+)""";
Match match = Regex.Match(html, pattern);
if (match.Success)
{
// 获取匹配到的 content 属性值
string contentValue = match.Groups[1].Value;
title_b = contentValue;
if (title_b.Trim() == "抖音-记录美好生活")
{
title_b = "";
}
Console.WriteLine("Content Value: " + contentValue);
}
else
{
Console.WriteLine("No meta tag found or content attribute not present.");
}
2. 视频下载地址标签和源码
public string mp4_ceng(string html)
{
string mp4_url = "";
string input = html;
string srcValue = GetSrcFromSourceTag(input);
mp4_url = srcValue;
return mp4_url;
}
static string GetSrcFromSourceTag(string input)
{
Regex regex = new Regex(@"<source[^>]+src\s*=\s*""([^""]+)""");
Match match = regex.Match(input);
if (match.Success)
{
return match.Groups[1].Value;
}
else
{
return null; // 或者抛出异常,视情况而定
}
}
三:界面展示及功能介绍
1. 关键词批量视频
1.1添加任务:输入任务名称,名称可以是此次任务的概括方便记录和查找;搜索词:自己想要搜索视频的关键词语;评论监控词:监控词可以是一个或多个(注:当输入多个监控词时,每个监控词之间要用英文输入法的逗号隔开)最后保存任务开始抓取数据。
1.2监控、历史任务:任务列表显示的是实时抓取到的数据有任务名称,搜索词,视频数量,评论数量,命中数量;
1.3未命中评论:未命中报表是指搜索的视频中评论不包含命中词的评论。
内容包括:评论人,评论视频名称,视频作者,评论地区,评论内容,评论时间,批次号
已命中评论:已命中报表的解释:评论中包含,任务中设置的有效命中词在此列表显示
内容包括:评论人,评论视频名称,视频作者,评论地区,评论内容,评论时间,命中词,批次号
1.4点击查看详细
点击列表中的评论内容显示评论详情窗口,可以查看评论的详细内容
详细内容包括:评论人,评论日期,评论视频,视频作者,视频地址,作者地址,评论人地址,评论内容,评论人二维码