AUCS Hackathon 2019:技术助力社区互动

需积分: 9 0 下载量 25 浏览量 更新于2024-11-18 收藏 15.66MB ZIP 举报
资源摘要信息:"AUCS_Hackathon_2019" 知识点一:Hackathon的定义和目的 Hackathon是一种常见的编程马拉松活动,通常是由多个程序员、开发人员、设计师和其他IT行业的专业人员参与。在短时间内,他们共同合作,围绕一个特定的主题或问题,创造出新的软件或硬件解决方案。AUCS_Hackathon_2019的目的就是通过技术改善本地社区之间的互动。 知识点二:Webapp的开发 Webapp,即Web应用程序,是一种通过网络浏览器访问的应用程序。与传统的桌面应用程序不同,Webapp不需要在用户的设备上安装,只要有网络浏览器,就可以随时随地访问和使用。Webapp的开发涉及到前端和后端的开发。前端主要负责用户界面和用户体验,后端主要负责服务器、应用程序和数据库之间的交互。 知识点三:Google Calendar API Google Calendar API是Google提供的一种服务,允许开发者访问Google日历的数据。通过这个API,开发者可以在自己的应用程序中集成日历功能,如创建、修改、删除事件,获取事件详情等。这对于需要日历功能的Webapp来说,是一个非常有用的工具。 知识点四:HTML HTML,全称超文本标记语言,是一种用于创建网页和网络应用程序的标准标记语言。HTML定义了网页的结构和内容,如标题、段落、链接、图片等。在AUCS_Hackathon_2019中,HTML无疑是创建Webapp前端界面的重要工具。 知识点五:技术改善本地社区之间的互动 这是一个非常有社会意义的目标。技术不仅可以提高我们的工作效率,也可以改变我们的生活方式。通过AUCS_Hackathon_2019这样的活动,开发者们可以利用他们的技术专长,创造出能够改善本地社区互动的解决方案。例如,他们可以创建一个平台,让社区成员分享信息、交流经验、组织活动等。 知识点六:项目管理 创建一个存储库来管理Webapp的开发,说明了项目管理的重要性。项目管理涉及到规划、组织、指导和控制项目资源,以实现特定目标。在Webapp开发中,有效的项目管理可以帮助团队更好地分工合作,提高开发效率,保证项目按时按质完成。

把这段代码的PCA换成LDA:LR_grid = LogisticRegression(max_iter=1000, random_state=42) LR_grid_search = GridSearchCV(LR_grid, param_grid=param_grid, cv=cvx ,scoring=scoring,n_jobs=10,verbose=0) LR_grid_search.fit(pca_X_train, train_y) estimators = [ ('lr', LR_grid_search.best_estimator_), ('svc', svc_grid_search.best_estimator_), ] clf = StackingClassifier(estimators=estimators, final_estimator=LinearSVC(C=5, random_state=42),n_jobs=10,verbose=1) clf.fit(pca_X_train, train_y) estimators = [ ('lr', LR_grid_search.best_estimator_), ('svc', svc_grid_search.best_estimator_), ] param_grid = {'final_estimator':[LogisticRegression(C=0.00001),LogisticRegression(C=0.0001), LogisticRegression(C=0.001),LogisticRegression(C=0.01), LogisticRegression(C=0.1),LogisticRegression(C=1), LogisticRegression(C=10),LogisticRegression(C=100), LogisticRegression(C=1000)]} Stacking_grid =StackingClassifier(estimators=estimators,) Stacking_grid_search = GridSearchCV(Stacking_grid, param_grid=param_grid, cv=cvx, scoring=scoring,n_jobs=10,verbose=0) Stacking_grid_search.fit(pca_X_train, train_y) Stacking_grid_search.best_estimator_ train_pre_y = cross_val_predict(Stacking_grid_search.best_estimator_, pca_X_train,train_y, cv=cvx) train_res1=get_measures_gridloo(train_y,train_pre_y) test_pre_y = Stacking_grid_search.predict(pca_X_test) test_res1=get_measures_gridloo(test_y,test_pre_y) best_pca_train_aucs.append(train_res1.loc[:,"AUC"]) best_pca_test_aucs.append(test_res1.loc[:,"AUC"]) best_pca_train_scores.append(train_res1) best_pca_test_scores.append(test_res1) train_aucs.append(np.max(best_pca_train_aucs)) test_aucs.append(best_pca_test_aucs[np.argmax(best_pca_train_aucs)].item()) train_scores.append(best_pca_train_scores[np.argmax(best_pca_train_aucs)]) test_scores.append(best_pca_test_scores[np.argmax(best_pca_train_aucs)]) pca_comp.append(n_components[np.argmax(best_pca_train_aucs)]) print("n_components:") print(n_components[np.argmax(best_pca_train_aucs)])

2023-07-22 上传

优化这段代码train_aucs=[] test_aucs=[]#train_aucs和test_aucs用来存储每次训练和测试的AUC值,AUC是一种常用的二分类模型性能评估指标 train_scores=[] test_scores=[]#train_scores和test_scores则是用来存储每次训练和测试的得分 loopn=5 #number of repetition while splitting train/test dataset with different random state. np.random.seed(10)#设置随机数生成器的种子,确保每次运行时生成的随机数一致。 random_states=np.random.choice(range(101), loopn, replace=False)#np.random.choice()用于从给定的范围内选择指定数量的随机数,range设置范围,loopn表示选择的随机数的数量,replace=False表示选择的随机数不可重复 scoring='f1'#设置性能指标 pca_comp=[]#设置空列表,储主成分分析(PCA)的组件 for i in range(loopn): train_X,test_X, train_y, test_y ,indices_train,indices_test= train_test_split(train, #通过train_test_split函数将数据集划分为训练集(train_X, train_y)和测试集(test_X, test_y),indices_train和indices_test返回索引 target,indices, test_size = 0.3,#数据集的70%,测试集占30% stratify=target, random_state=random_states[i]#随机状态(random_states[i])添加到random_states列表中 ) print("train_x.shpae:") print(train_X.shape) standardScaler = StandardScaler() standardScaler.fit(train_X) X_standard = standardScaler.transform(train_X) X_standard_test = standardScaler.transform(test_X) #calculate max n_components estimator = PCA(n_components=0.99,random_state=42) pca_X_train = estimator.fit_transform(X_standard) n_components=range(10,min(pca_X_train.shape),10) print(n_components) best_pca_train_aucs=[] best_pca_test_aucs=[] best_pca_train_scores=[] best_pca_test_scores=[]

2023-07-14 上传