<?xml version="1.0" encoding="utf-8"?><?xml-stylesheet type='text/xsl' href='http://taobaodw.spaces.live.com/mmm2008-07-24_12.50/rsspretty.aspx?rssquery=en-US;http%3a%2f%2ftaobaodw.spaces.live.com%2ffeed.rss' version='1.0'?><rss version="2.0" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" xmlns:msn="http://schemas.microsoft.com/msn/spaces/2005/rss" xmlns:live="http://schemas.microsoft.com/live/spaces/2006/rss" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:cf="http://www.microsoft.com/schemas/rss/core/2005" xmlns:wfw="http://wellformedweb.org/CommentAPI/"><channel><title>淘宝数据仓库之路</title><description /><link>http://taobaodw.spaces.live.com/</link><language>en-US</language><pubDate>Fri, 13 Jun 2008 05:15:55 GMT</pubDate><lastBuildDate>Fri, 13 Jun 2008 05:15:55 GMT</lastBuildDate><generator>Microsoft Spaces v1.1</generator><docs>http://www.rssboard.org/rss-specification</docs><ttl>60</ttl><live:identity><live:id>-3819017003171160776</live:id><live:alias>taobaodw</live:alias></live:identity><cf:listinfo><cf:group ns="http://schemas.microsoft.com/live/spaces/2006/rss" element="typelabel" label="Type" /><cf:group ns="http://schemas.microsoft.com/live/spaces/2006/rss" element="tag" label="Tag" /><cf:group element="category" label="Category" /><cf:sort element="pubDate" label="Date" data-type="date" default="true" /><cf:sort element="title" label="Title" data-type="string" /><cf:sort ns="http://purl.org/rss/1.0/modules/slash/" element="comments" label="Comments" data-type="number" /></cf:listinfo><item><title>ETL实施方案探讨</title><link>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3132.entry</link><description>&lt;p&gt;实施数据仓库，ETL都是最基础最重要的一个环节，ETL只是一个抽象的概念，抽取-&amp;gt;转换-&amp;gt;加载, &lt;p&gt;但随着数据仓库的普及和众多国际厂商的积极参与，ETL的市场的竞争也是日趋白热化。商业ETL工具 &lt;p&gt;一直以来都是天价，看中的就是企业对核心数据集成的重视，也从另外一方面说明了ETL在数据仓库 &lt;p&gt;实施中的重要性。当然廉价的ETL实施也是可以的，只要有足够强的开放团队，目前开源软件也不断出现 &lt;p&gt;ETL的软件，不过没有太多的技术支持，比如Kettle。这里我们重点讨论商业ETL工具和自主开放实现两 &lt;p&gt;套方案。 &lt;p&gt;商业ETL工具有IBM的Datastage，小oracle之称的Informatica，oracle 的ODI。 &lt;p&gt;三者都是重量级别的ETL工具。前两者从技术上确切来说应该是ETL实现，而oracle的ODI则是ELT，也就是利用oracle的RAC数据库进行转换这一步核心处理，前两者需要单独的转换处理的ETL服务器，ODI则不需要。 &lt;p&gt;如果自主开放ETL系统，那么需要有一个ETL的构架师，能够用代码来实现元数据管理，任务调度和复杂的转换逻辑，清晰的数据层次等。&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-3819017003171160776&amp;page=RSS%3a+ETL%e5%ae%9e%e6%96%bd%e6%96%b9%e6%a1%88%e6%8e%a2%e8%ae%a8&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=taobaodw.spaces.live.com&amp;amp;GT1=taobaodw"&gt;</description><comments>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3132.entry#comment</comments><guid isPermaLink="true">http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3132.entry</guid><pubDate>Tue, 08 Jan 2008 09:23:32 GMT</pubDate><slash:comments>0</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://taobaodw.spaces.live.com/blog/cns!CB00204506CE5D38!3132/comments/feed.rss</wfw:commentRss><wfw:comment>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3132.entry#comment</wfw:comment><dcterms:modified>2008-01-08T09:23:32Z</dcterms:modified></item><item><title>数据挖掘软件技术方案（综述）</title><link>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3131.entry</link><description>&lt;p&gt;数据挖掘是在数据仓库之上的一个重要应用，在建立了拥有海量数据的数据仓库后，数据挖掘技术 &lt;p&gt;能利用很多数学的算法来挖掘数据中蕴含的价值和规则，进行商业应用和决策支持。目前在国际上 &lt;p&gt;流行的数据挖掘厂商和方案很多，实力和特色也各具特色，主要有：SAS EM，SPSS Clementine， &lt;p&gt;Oracle ODM等。这些工具背后都是国际大厂商，SAS EM背靠SAS统计分析的鼻祖，从专业上来讲 &lt;p&gt;不容置疑，Clementine从易用性来讲很容易上手，但在处理海量数据上稍逊一筹，ODM依托Oracle &lt;p&gt;RAC的强大计算能力，在实施能力强悍的团队里面能发挥很好的威力，至于微软的sql server集成的 &lt;p&gt;DM工具，由于微软工具的普及和人性化，基本上能快速完成一些中小规模的数据挖掘任务。&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-3819017003171160776&amp;page=RSS%3a+%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98%e8%bd%af%e4%bb%b6%e6%8a%80%e6%9c%af%e6%96%b9%e6%a1%88%ef%bc%88%e7%bb%bc%e8%bf%b0%ef%bc%89&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=taobaodw.spaces.live.com&amp;amp;GT1=taobaodw"&gt;</description><comments>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3131.entry#comment</comments><guid isPermaLink="true">http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3131.entry</guid><pubDate>Tue, 08 Jan 2008 08:59:50 GMT</pubDate><slash:comments>0</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://taobaodw.spaces.live.com/blog/cns!CB00204506CE5D38!3131/comments/feed.rss</wfw:commentRss><wfw:comment>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3131.entry#comment</wfw:comment><dcterms:modified>2008-01-24T01:02:21Z</dcterms:modified></item><item><title>数据仓库基础平台（1）</title><link>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3130.entry</link><description>&lt;p&gt;数据仓库基础平台包含范围非常广泛，这篇文章先讨论DB方面的平台架构。 &lt;p&gt;国际主要厂商：Oracle，Teradata，DB2，Sql server，Mysql都推出了 &lt;p&gt;数据仓库基础数据库版本。这些厂商坚守两大阵营，share nothing和share  &lt;p&gt;everything。 &lt;p&gt;share nothing最显著代表有Teradata，DB2 .share everything典型是Oracle  &lt;p&gt;RAC。 &lt;p&gt;从平台的开放和封闭来分的话，有封闭平台Teradata,有走开放平台的DB2,Oracle。 &lt;p&gt;陆续有新生力量在加入这2大阵营。有主推即买即用封闭平台的，也有主推根据用户 &lt;p&gt;需求量身定制开放平台的，孰优孰劣，这里不做评价。 &lt;p&gt;这里提到的每中数据仓库基础平台都值得深入研究，都能发现有很大的优点，如果能综合 &lt;p&gt;起来，相信未来的数据仓库基础平台会更加完善。当然典型厂商都在互相学习，把竞争对手 &lt;p&gt;的优势融合到自己的产品中，这对最终用户的使用是很有利的，不过从纯技术上也就更难取舍。&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-3819017003171160776&amp;page=RSS%3a+%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e5%9f%ba%e7%a1%80%e5%b9%b3%e5%8f%b0%ef%bc%881%ef%bc%89&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=taobaodw.spaces.live.com&amp;amp;GT1=taobaodw"&gt;</description><comments>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3130.entry#comment</comments><guid isPermaLink="true">http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3130.entry</guid><pubDate>Tue, 08 Jan 2008 08:02:22 GMT</pubDate><slash:comments>0</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://taobaodw.spaces.live.com/blog/cns!CB00204506CE5D38!3130/comments/feed.rss</wfw:commentRss><wfw:comment>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3130.entry#comment</wfw:comment><dcterms:modified>2008-01-08T08:02:22Z</dcterms:modified></item><item><title>数据仓库实施之路</title><link>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3127.entry</link><description>&lt;div&gt;数据仓库实施之路是一条漫长而且充满挑战但是也充满乐趣的，需要对业务系统非常熟悉，&lt;/div&gt;
&lt;div&gt;并对技术充分掌握，而且要平衡各个方面的需求，设计出一套能高度灵活的数据仓库架构，&lt;/div&gt;
&lt;div&gt;适应商业的快速发展。&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-3819017003171160776&amp;page=RSS%3a+%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e5%ae%9e%e6%96%bd%e4%b9%8b%e8%b7%af&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=taobaodw.spaces.live.com&amp;amp;GT1=taobaodw"&gt;</description><comments>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3127.entry#comment</comments><guid isPermaLink="true">http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3127.entry</guid><pubDate>Tue, 08 Jan 2008 07:45:22 GMT</pubDate><slash:comments>0</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://taobaodw.spaces.live.com/blog/cns!CB00204506CE5D38!3127/comments/feed.rss</wfw:commentRss><wfw:comment>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3127.entry#comment</wfw:comment><dcterms:modified>2008-01-08T07:45:22Z</dcterms:modified></item><item><title>淘宝数据仓库之路</title><link>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3121.entry</link><description>2008年，随着互联网的持续升温，数据仓库技术在国内得到了快速的发展，如何把数据仓库的技术&lt;br&gt;和互联网行业很好的融合起来，推动数据仓库的技术发展，推动互联网模式的改变，希望这里能成为&lt;br&gt;国内众多行家里手交流的地方，大家一起努力！
&lt;div&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-3819017003171160776&amp;page=RSS%3a+%e6%b7%98%e5%ae%9d%e6%95%b0%e6%8d%ae%e4%bb%93%e5%ba%93%e4%b9%8b%e8%b7%af&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=taobaodw.spaces.live.com&amp;amp;GT1=taobaodw"&gt;</description><comments>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3121.entry#comment</comments><guid isPermaLink="true">http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3121.entry</guid><pubDate>Tue, 08 Jan 2008 07:15:10 GMT</pubDate><slash:comments>0</slash:comments><msn:type>blogentry</msn:type><live:type>blogentry</live:type><live:typelabel>Blog entry</live:typelabel><wfw:commentRss>http://taobaodw.spaces.live.com/blog/cns!CB00204506CE5D38!3121/comments/feed.rss</wfw:commentRss><wfw:comment>http://taobaodw.spaces.live.com/Blog/cns!CB00204506CE5D38!3121.entry#comment</wfw:comment><dcterms:modified>2008-01-08T07:15:10Z</dcterms:modified></item><item><title>Music List: beyond</title><link>http://taobaodw.spaces.live.com/Music/cns!CB00204506CE5D38!3134</link><description>&lt;p&gt;beyond&lt;/p&gt;&lt;div&gt;&lt;ul&gt;&lt;li&gt;&lt;p&gt;&lt;a href="http://www.6621.com&amp;#47;Music&amp;#47;17D8BF59C.html"&gt;beyond: &amp;#28023;&amp;#38420;&amp;#22825;&amp;#31354;&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;&lt;/ul&gt;&lt;/div&gt;&lt;img src="http://c.services.spaces.live.com/CollectionWebService/c.gif?cid=-3819017003171160776&amp;page=RSS%3a+Music+List%3a+beyond&amp;referrer=" width="1px" height="1px" border="0" alt=""&gt;&lt;img style="position:absolute" alt="" width="0px" height="0px" src="http://c.live.com/c.gif?NC=31263&amp;amp;NA=1149&amp;amp;PI=73329&amp;amp;RF=&amp;amp;DI=3919&amp;amp;PS=85545&amp;amp;TP=taobaodw.spaces.live.com&amp;amp;GT1=taobaodw"&gt;</description><guid isPermaLink="false">cns!CB00204506CE5D38!3134</guid><pubDate>Tue, 08 Jan 2008 12:37:53 GMT</pubDate><msn:type>musiclist</msn:type><live:type>musiclist</live:type><live:typelabel>Music list</live:typelabel><cf:itemRSS>http://taobaodw.spaces.live.com/lists/cns!CB00204506CE5D38!3134/feed.rss</cf:itemRSS><dcterms:modified>2008-01-08T12:37:53Z</dcterms:modified></item></channel></rss>