没有合适的资源?快使用搜索试试~ 我知道了~
首页SQL Server 2018/2019:数据科学入门指南
"《SQL Server快速入门指南:数据科学实战》是一本专为那些在SQL Server与数据科学领域都有深厚背景的专业人士量身打造的教程。自SQL Server最新的两个版本开始,它全面支持数据科学工作,为读者提供了如何将SQL Server与机器学习(ML)服务整合到项目中的实用指南。 本书首先介绍了Microsoft SQL Server与数据库内ML服务的数据科学基础,涵盖了数据科学项目的所有阶段,包括业务理解和数据概述、数据预处理、模型构建、算法应用、模型评估以及部署。作者通过详细讲解,使读者能够熟练运用SQL Server自带的引擎和语言,如R和Python语言的ML服务,以及Transact-SQL。 书中强调了如何根据具体任务选择合适的算法,深入剖析每个算法的工作原理。无论是对SQL Server环境不熟悉的初学者,还是希望提升在现有平台中进行数据科学实践能力的专家,这本书都是一次宝贵的学习之旅。值得注意的是,版权信息指出,未经出版商书面许可,书中的任何部分不得复制、存储或以任何形式传播,且本书销售时并不提供任何形式的保证,包括明示或暗示的保修,出版方和作者不对因本书产生的直接或间接损失负责。 此外,本书由Amey Varangaonkar担任委派编辑,Res先生担任获取编辑,展现了Packt Publishing严谨的编审流程。通过阅读这本书,读者不仅能够掌握SQL Server在数据科学领域的应用,还能提升自己的技术实践能力,推动业务决策的智能化进程。"
资源详情
资源推荐
Preface
Thebookwillgiveyouajump-startindatasciencewithMicrosoftSQLServer
andin-databaseMachineLearningServices(MLServices).Itcoversallstagesof
adatascienceproject,frombusinessanddataunderstandingthroughdata
overview,datapreparation,andmodeling,tousingalgorithms,modelevaluation,
anddeployment.Thebookshowshowtousetheenginesandlanguagesthat
comewithSQLServer,includingMLServiceswithR,Python,andTransact-
SQL(T-SQL).Youwillfindusefulcodeexamplesinallthreelanguages
mentioned.Thebookalsoshowswhichalgorithmstouseforwhichtasks,and
brieflyexplainseachalgorithm.
Whothisbookisfor
SQLServeronlystartedtofullysupportdatasciencewithitstwolatestversions,
2016and2017.Therefore,SQLServerisnotwidelyusedfordatascienceyet.
However,thereareprofessionalsfromtheworldsofSQLServeranddata
sciencewhoareinterestedinusingSQLServerandMLServicesfortheir
projects.Therefore,thisbookisintendedforSQLServerprofessionalswhowant
tostartwithdatascience,anddatascientistswhowouldliketostartusingSQL
Serverintheirprojects.
Whatthisbookcovers
Chapter1,WritingQuerieswithT-SQL,givesabriefoverviewofT-SQLqueries.
ItintroducesalloftheimportantpartsofthemightySELECTstatementandfocuses
onanalyticalqueries.
Chapter2,IntroducingR,introducesthesecondlanguageinthisbook,R.Rhas
beensupportedinSQLServersinceversion2016.Inordertouseitproperly,you
havetounderstandthelanguageconstructsanddatastructures.
Chapter3,GettingFamiliarwithPython,givesanoverviewofthesecondmost
populardatasciencelanguage,Python.Asamoregenerallanguage,Pythonis
probablyevenmorepopularthanR.Lately,PythonhasbeencatchingupwithR
inthedatasciencefield.
Chapter4,DataOverview,dealswithunderstandingdata.Youcanuse
introductorystatisticsandbasicgraphsforthistask.Youwilllearnhowto
performadataoverviewinallthreelanguagesusedinthisbook.
Chapter5,DataPreparation,teachesyouhowtoworkwiththedatathatyouget
fromyourbusinesssystemsandfromdatawarehouses,whichistypicallynot
suitedfordirectuseinamachinelearningproject.Youneedtoaddderived
variables,dealwithoutliersandmissingvalues,andmore.
Chapter6,IntermediateStatisticsandGraphs,startswiththerealanalysisofthe
data.Youcanuseintermediate-levelstatisticalmethodsandgraphsforthe
beginningofyouradvancedanalyticsjourney.
Chapter7,UnsupervisedMachineLearning,explainsthealgorithmsthatdonot
useatargetvariable.Itislikefishinginthemud-youtryandseeifsome
meaningfulinformationcanbeextractedfromyourdata.Themostcommon
undirectedtechniquesareclustering,dimensionalityreduction,andaffinity
grouping,alsoknownasbasketanalysisorassociationrules.
Chapter8,SupervisedMachineLearning,dealswiththealgorithmsthatneeda
targetvariable.Someofthemostimportantdirectedtechniquesinclude
classificationandestimation.Classificationmeansexamininganewcaseand
assigningittoapredefineddiscreteclass,forexample,assigningkeywordsto
articlesandassigningcustomerstoknownsegments.Nextisestimation,where
youtrytoestimatethevalueofacontinuousvariableofanewcase.Youcan,for
example,estimatethenumberofchildrenorthefamilyincome.Thischapter
alsoshowsyouhowyoucanevaluateyourmachinelearningmodelsanduse
themforpredictions.
Togetthemostoutofthisbook
Inordertorunthedemocodeassociatedwiththisbook,youwillneedSQL
Server2017,SQLServerManagementStudio,andVisualStudio2017.
Alloftheinformationabouttheinstallationofthesoftwareneededtorunthe
codeisincludedinthefirstthreechaptersofthebook.
剩余245页未读,继续阅读
tlforest
- 粉丝: 27
- 资源: 198
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C语言快速排序算法的实现与应用
- KityFormula 编辑器压缩包功能解析
- 离线搭建Kubernetes 1.17.0集群教程与资源包分享
- Java毕业设计教学平台完整教程与源码
- 综合数据集汇总:浏览记录与市场研究分析
- STM32智能家居控制系统:创新设计与无线通讯
- 深入浅出C++20标准:四大新特性解析
- Real-ESRGAN: 开源项目提升图像超分辨率技术
- 植物大战僵尸杂交版v2.0.88:新元素新挑战
- 掌握数据分析核心模型,预测未来不是梦
- Android平台蓝牙HC-06/08模块数据交互技巧
- Python源码分享:计算100至200之间的所有素数
- 免费视频修复利器:Digital Video Repair
- Chrome浏览器新版本Adblock Plus插件发布
- GifSplitter:Linux下GIF转BMP的核心工具
- Vue.js开发教程:全面学习资源指南
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功