Data Science and Classification (eBook)
XII, 358 Seiten
Springer Berlin (Verlag)
978-3-540-34416-2 (ISBN)
Data Science and Classification provides new methodological developments in data analysis and classification. The broad and comprehensive coverage includes the measurement of similarity and dissimilarity, methods for classification and clustering, network and graph analyses, analysis of symbolic data, and web mining. Beyond structural and theoretical results, the book offers application advice for a variety of problems, in medicine, microarray analysis, social network structures, and music.
Preface 6
The 10th IFCS Conference – a Jubilee 7
Contents 9
Similarity and Dissimilarity 13
A Tree-Based Similarity for Evaluating Concept Proximities in an Ontology 14
Improved Frechet Distance for Time Series 23
Comparison of Distance Indices Between Partitions 31
Design of Dissimilarity Measures: A New Dissimilarity Between Species Distribution Areas 39
Dissimilarities for Web Usage Mining 48
Properties and Performance of Shape Similarity Measures 56
Classification and Clustering 66
Hierarchical Clustering for Boxplot Variables 67
Evaluation of Allocation Rules Under Some Cost Constraints 75
Crisp Partitions Induced by a Fuzzy Set 82
Empirical Comparison of a Monothetic Divisive Clustering Method with the Ward and the k- means Clustering Methods 90
Model Selection for the Binary Latent Class Model: A Monte Carlo Simulation 98
Finding Meaningful and Stable Clusters Using Local Cluster Analysis 107
Comparing Optimal Individual and Collective Assessment Procedures 115
Network and Graph Analysis 123
Some Open Problem Sets for Generalized Blockmodeling 124
Spectral Clustering and Multidimensional Scaling: A Unified View 136
Analyzing the Structure of U.S. Patents Network 145
Identifying and Classifying Social Groups: A Machine Learning Approach 153
Analysis of Symbolic Data 162
Multidimensional Scaling of Histogram Dissimilarities 163
Dependence and Interdependence Analysis for Interval- Valued Variables 173
A New Wasserstein Based Distance for the Hierarchical Clustering of Histogram Symbolic Data 186
Symbolic Clustering of Large Datasets 194
A Dynamic Clustering Method for Mixed Feature- Type Symbolic Data 203
General Data Analysis Methods 211
Iterated Boosting for Outlier Detection 212
Sub-species of Homopus Areolatus? Biplots and Small Class Inference with Analysis of Distance 220
Revised Boxplot Based Discretization as the Kernel of Automatic Interpretation of Classes Using Numerical Variables 228
Data and Web Mining 237
Comparison of Two Methods for Detecting and Correcting Systematic Error in High- throughput Screening Data 238
kNN Versus SVM in the Collaborative Filtering Framework 247
Mining Association Rules in Folksonomies 257
Empirical Analysis of Attribute-Aware Recommendation Algorithms with Variable Synthetic Data 267
Patterns of Associations in Finite Sets of Items 275
Analysis of Music Data 283
Generalized N-gram Measures for Melodic Similarity 284
Evaluating Different Approaches to Measuring the Similarity of Melodies 294
Using MCMC as a Stochastic Optimization Procedure for Musical Time Series 302
Local Models in Register Classification by Timbre 310
Gene and Microarray Analysis 318
Improving the Performance of Principal Components for Classification of Gene Expression Data Through Feature Selection 319
A New Efficient Method for Assessing Missing Nucleotides in DNA Sequences in the Framework of a Generic Evolutionary Model 327
New Efficient Algorithm for Modeling Partial and Complete Gene Transfer Scenarios 335
List of Reviewers 344
Key words 346
Authors 349
Erscheint lt. Verlag | 5.9.2006 |
---|---|
Reihe/Serie | Studies in Classification, Data Analysis, and Knowledge Organization | Studies in Classification, Data Analysis, and Knowledge Organization |
Zusatzinfo | XII, 358 p. 67 illus. |
Verlagsort | Berlin |
Sprache | englisch |
Themenwelt | Mathematik / Informatik ► Informatik ► Web / Internet |
Mathematik / Informatik ► Mathematik ► Statistik | |
Mathematik / Informatik ► Mathematik ► Wahrscheinlichkeit / Kombinatorik | |
Sozialwissenschaften ► Kommunikation / Medien ► Buchhandel / Bibliothekswesen | |
Sozialwissenschaften ► Politik / Verwaltung | |
Technik | |
Wirtschaft | |
Schlagworte | Boxplot • classification • cluster analysis • Data Analysis • Data Mining • Data Science • ITEM • machine learning • Monte Carlo simulation • Multidimensional Scaling • Ontology • Optimization • proving • Sage • Symbol • Time Series • Web mining |
ISBN-10 | 3-540-34416-0 / 3540344160 |
ISBN-13 | 978-3-540-34416-2 / 9783540344162 |
Haben Sie eine Frage zum Produkt? |
Größe: 4,8 MB
DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasserzeichen und ist damit für Sie personalisiert. Bei einer missbräuchlichen Weitergabe des eBooks an Dritte ist eine Rückverfolgung an die Quelle möglich.
Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.
Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür einen PDF-Viewer - z.B. den Adobe Reader oder Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür einen PDF-Viewer - z.B. die kostenlose Adobe Digital Editions-App.
Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.
Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.
aus dem Bereich