我必须使用机器学习技术自动分析JSON日志文件,以便更好地了解用户行为并识别经常执行的操作以提高应用程序的可用性。该日志文件包含诸如文件系统事件,鼠标事件,键盘事件,应用程序事件(启动,终止,活动,停用,...),...在使用特定应用程序期间记录的条目。
记录的条目看起来像这样:
{
"timestamp" : "20150427T100724.571637",
"entry" :
{
"eventType" : 1,
"eventTypeString" : "created",
"nodePath" : "/Applications/Firefox.app",
"nodeType" : 3,
"nodeTypeString" : "directory"
},
"entryType" : 4
},
{
"timestamp" : "20150427T100729.072595",
"entry" :
{
"eventType" : 2,
"eventTypeString" : "clickRight",
"mouseType" : 1,
"mouseTypeString" : "local",
"positionX" : 2517,
"positionY" : 166,
"scrollWheel" : 0.0
},
"entryType" : 1
},
{
"timestamp" : "20150427T100730.270000",
"entry" :
{
"eventType" : 2,
"eventTypeString" : "unmounted",
"volumeName" : "Firefox",
"volumePath" : "/Volumes/Firefox"
},
"entryType" : 9
},
{
"timestamp" : "20150427T100730.281202",
"entry" :
{
"eventType" : 2,
"eventTypeString" : "removed",
"nodePath" : "/Volumes/Firefox",
"nodeType" : 3,
"nodeTypeString" : "directory"
},
"entryType" : 4
},
{
"timestamp" : "20150427T100732.668000",
"entry" :
{
"eventType" : 4,
"eventTypeString" : "activated",
"launchDate" : "20150427T100732.668000",
"ownsMenuBar" : true,
"processId" : 7011,
"processName" : "TeamViewer"
},
"entryType" : 5
},
我已经进入了机器学习的主题,但是我不知道该领域的哪个特定技术甚至可以帮助我解决这个问题。也许有人有提示或想法在哪里可以找到解决方案的正确信息或概念?
好吧,我的问题对我来说并不完全清楚,但是我根据这些意见理解的是什么。
- 分类,不确定如何在此处应用。
-
聚类与上述相同,
-
概率特别是概率图形模型的范围,EX在文件系统中,如果他打开了C://,则很可能他的下一个文件夹可以是Rihanna文件夹或Emineem,这些内容在一定程度上可以通过图形模型来建模。您可以制作自定义模型。这是一个Hugh主题,请查看此
https://class.coursera.org/pgm/lecture