做网站分析该如何构建数据仓库?

geodetic 2004-03-02 08:29:02
做网站分析(统计点击热点、活跃IP、访问者地区分布等)
原始数据从Web服务器日志导入,该如何构建数据仓库?
日志文件很大,用什么方案导入比较有效率?
请指教,谢谢。
...全文
39 7 打赏 收藏 转发到动态 举报
写回复
用AI写文章
7 条回复
切换为时间正序
请发表友善的回复…
发表回复
zjcxc 2004-03-18
  • 打赏
  • 举报
回复
导入用BCP,速度较快,也较方便控制.

至于表结构及导入的具体设置,要根据你的日志文件结构
及具体的统计分析要求才能确定.
zjcxc 2004-03-18
  • 打赏
  • 举报
回复
/*--实现数据导入/导出的存储过程

可以实现导入/导出 指定表 到文本文件
支持自定义行/列分隔符

--邹建 2003.07--*/

/*--调用示例
导出调用示例
--导出指定表,这里指定导出表:地区资料
exec file2table 'zj','','','c:\zj.txt','xzkh_new..地区资料',@rowsplit=','

导入调用示例
--导入指定表,这里指定导入表:地区资料
exec file2table 'zj','','','c:\zj.txt','xzkh_sa..地区资料',0
--*/

if exists(select 1 from sysobjects where name='File2Table' and objectproperty(id,'IsProcedure')=1)
drop procedure File2Table
go

create procedure File2Table
@servername varchar(200) --服务器名
,@username varchar(200) --用户名,如果用NT验证方式,则为空''
,@password varchar(200) --密码
,@filename varchar(1000) --目录名+文件名
,@tbname varchar(500)='' --数据库..表名
,@isout bit=1 --1为导出(默认),0为导入
,@fdsplit varchar(10)='\t' --字段分隔符,默认为制表符
,@rowsplit varchar(10)='\n' --记录分隔符,默认为回车符
as
declare @sql varchar(8000)

set @sql='bcp "'+@tbname
+case when @isout=1 then '" out' else '" in' end
+' "'+@filename+'" /c' +' /S"'+@servername
+case when isnull(@username,'')='' then ''
else '" /U"'+@username end
+'" /P"'+isnull(@password,'')+'"'
+' /t"'+@fdsplit+'"'
+' /r"'+@rowsplit+'"'

exec master..xp_cmdshell @sql
go
zzjjob 2004-03-16
  • 打赏
  • 举报
回复
感谢!
zzjjob@163.com
hnahzx 2004-03-16
  • 打赏
  • 举报
回复
谢谢!我也想学习
zhangxing1981@126.com
geodetic 2004-03-16
  • 打赏
  • 举报
回复
up
chqq009 2004-03-15
  • 打赏
  • 举报
回复
to newline(新视线):
如果方便的话也请发一份到:chqq005@163.com
谢谢

geodetic 2004-03-14
  • 打赏
  • 举报
回复
to newline(新视线):
可以看看您的文档和程序吗?谢谢。
我的mail:geodesic@mail.biti.edu.cn

看了一些网站评价的商业化软件包的demo,感觉他们的东西并不是真正的data mining,还是一些比较简单的统计;对分析算法,大家有什么好建议?望不吝赐教,谢谢。

7,388

社区成员

发帖
与我相关
我的任务
社区描述
其他数据库开发 数据仓库
社区管理员
  • 数据仓库
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧