Graphic summary
  • Show / hide key
  • Information


Scientific and technological production
  •  

1 to 50 of 165 results
  • A Bayesian cluster analysis of election results

     Puig Oriol, Xavier; Ginebra Molins, Josep
    Journal of Applied Statistics
    Date of publication: 2014
    Journal article

    Read the abstract Read the abstract View View Open in new window  Share Reference managers Reference managers Open in new window

    A Bayesian cluster analysis for the results of an election based on multinomial mixture models is proposed. The number of clusters is chosen based on the careful comparison of the results with predictive simulations from the models, and by checking whether models capture most of the spatial dependence in the results. By implementing the analysis on five recent elections in Barcelona, the reader is walked through the choice of the best statistics and graphical displays to help chose a model and present the results. Even though the models do not use any information about the location of the areas in which the results are broken into, in the example they uncover a four-cluster structure with a strong spatial dependence, that is very stable over time and relates to the demographic composition.

  • A Cluster analysis of vote transitions

     Puig Oriol, Xavier; Ginebra Molins, Josep
    Computational statistics and data analysis
    Date of publication: 2014
    Journal article

    Read the abstract Read the abstract View View Open in new window  Share Reference managers Reference managers Open in new window

    To help settle the debate triggered the day after any election around the origin and destination of the vote of winners and losers, a Bayesian analysis of the results in a pair of consecutive elections is proposed. It is based on a model that simultaneously carries out a cluster analysis of the areas in which the results are broken into and links the results in the two elections of areas in a given cluster through a vote switch matrix. The number of clusters is chosen both through predictive checks as well as by testing whether the residuals are spatially correlated or not. The analysis is tried on the results in Barcelona of a pair of consecutive elections held just four months apart, in 2003 for the Catalan parliament and in 2004 for the Spanish parliament. The proposed approach, which reconstructs individual behavior from aggregated data, can be exported to be a solution for any ecological inference problem where one cannot assume that all the areas are exchangeable the way typically assumed by other ecological inference methods.

  • On poisson-stopped-sums that are mixed poisson

     Valero Baya, Jordi; Perez Casany, Marta; Ginebra Molins, Josep
    Statistics and probability letters
    Date of publication: 2013
    Journal article

    Read the abstract Read the abstract View View Open in new window  Share Reference managers Reference managers Open in new window

    Maceda (1948) characterized the mixed Poisson distributions that are Poisson-stopped-sum distributions based on the mixing distribution. In an alternative characterization of the same set of distributions here the Poisson-stopped-sum distributions that are mixed Poisson distributions is proved to be the set of Poisson-stopped-sums of either a mixture of zero-truncated Poisson distributions or a zero-modification of it.

    Maceda (1948) characterized the mixed Poisson distributions that are Poisson-stopped-sum distributions based on the mixing distribution. In an alternative characterization of the same set of distributions here the Poisson-stopped-sum distributions that are mixed Poisson distributions is proved to be the set of Poisson-stopped-sums of either a mixture of zero-truncated Poisson distributions or a zero-modification of it.

  • Particle filtering estimation for linear and nonlinear state-space models

     Acosta Argueta, Lesly Maria
    Defense's date: 2013-11-29
    Universitat Politècnica de Catalunya
    Theses

     Share Reference managers Reference managers Open in new window

  • Bayesian analysis of frequency count data

     Font Valverde, Marti; Puig Oriol, Xavier; Ginebra Molins, Josep
    Journal of statistical computation and simulation
    Date of publication: 2013-02
    Journal article

    Read the abstract Read the abstract View View Open in new window  Share Reference managers Reference managers Open in new window

    The zero truncated inverse Gaussian–Poisson model, obtained by first mixing the Poisson model assuming its expected value has an inverse Gaussian distribution and then truncating the model at zero, is very useful when modelling frequency count data. A Bayesian analysis based on this statistical model is implemented on the word frequency counts of various texts, and its validity is checked by exploring the posterior distribution of the Pearson errors and by implementing posterior predictive consistency checks. The analysis based on this model is useful because it allows one to use the posterior distribution of the model mixing density as an approximation of the posterior distribution of the density of the word frequencies of the vocabulary of the author, which is useful to characterize the style of that author. The posterior distribution of the expectation and of measures of the variability of that mixing distribution can be used to assess the size and diversity of his vocabulary. An alternative analysis is proposed based on the inverse Gaussian-zero truncated Poisson mixture model, which is obtained by switching the order of the mixing and the truncation stages. Even though this second model fits some of the word frequency data sets more accurately than the first model, in practice the analysis based on it is not as useful because it does not allow one to estimate the word frequency distribution of the vocabulary.

  • Decisions that Make Things Work Better. An Analysis of the Quality Concept.  Open access

     Camps Lorente, Oriol
    Defense's date: 2012-07-06
    Department of Statistics and Operations Research, Universitat Politècnica de Catalunya
    Theses

    Read the abstract Read the abstract Access to the full text Access to the full text Open in new window  Share Reference managers Reference managers Open in new window

    The present thesis is aimed at analyzing the concept of quality and at dis-cussing, in a unified manner, its role not only in operations management but also in strategic thinking. It criticizes the widespread view that quality is meeting the client’s needs and expectations in such a way that the gap between perceptions and expectations is minimized. Essentially it develops a systematic proposal in order to understand the concept on the intui-tive basis that quality is tantamount to how well something works for a given purpose. The analysis is based on the fact that anytime that the quality concept is used there are actors that carry out an action with the help of a means—thus quality is a particular sort of means-ends fitness. Roughly speaking, the quality of a means is its capability to improve the expected conse-quences of the action. The analysis shows under which conditions this conclusion can be understood in terms of multi-attribute preference orderings under uncertainty—some ideas from decision theory, which are required in order to do that, are presented. In short, whether the expected consequences improve or not depends on an assumed preference ordering that has to be correct given the actors’ circumstances and purposes—but it may be distinct from the actual preferences of many individual actors. Quality is neither subjective (it does not change depending on the psychological processes of any particular individual) nor objective (in a sense, it depends on action and cognition), but it is relative to a given set of reference preferences. Some conditions apply to what it counts as a means, how it relates to an end, which attributes are relevant to assess consequences, or which reference preferences are well-formed. In particular, I discuss to which kind of means the concept is properly applied. As a complement, a basic model of means-ends relationships (built on several properties of Boolean functions) is presented. At a slightly more technical level, it shows relevant insights, but strictly speaking it is not required in order to understand the rest of the thesis. Quality appears in management under two interrelated forms: (a) or-ganizations’ interventions in the quality of what they use and provide and (b) organizations’ initiatives to compete through quality. (a) The basic structure behind quality management is examined under the lens of the quality concept’s analysis. The following issues are dis-cussed: setting quality criteria, product design, process design, onsite planning, onsite control, standardization, product improvement, process improvement and rethinking reference preferences. (b) The role of quality on competitive advantage and sustainable profit-ability depends on how quality relates to entry barriers. I show different ways in which quality can interact (if it does) with product differentiation, experience effects, scope economies, reputation, capital requirements, access to distribution channels, switching costs, legal barriers or scale economies. The strength of quality as a driver of profitability is dis-cussed—the conclusion is that it is not easy to build sustainable competitive advantages on the basis of quality alone and that its complementary role in competition has several aspects that are needed to be taken into account. Finally, the particular example of how the quality concept works in re-lation to information flows is treated in some detail. Information flows are processes that move information from the firm’s inner or outer environ-ment to actions. Decisive factors of its quality (basically, information asymmetries and coherence) are discussed. Two actual case studies are presented. The example of information flows is aimed at showing the mo-tivation for a general analysis of the quality concept beyond sloganlike statements about clients, products, perceptions and expectations.

    La tesis tiene como objetivo analizar el concepto de calidad y discutir de forma unificada su papel tanto en la dirección de operaciones como en el pensamiento estratégico. El trabajo argumenta en contra de la opinión generalizada de que la calidad es satisfacer las necesidades y expectativas del cliente de tal manera que la diferencia entre percepciones y expectativas se reduzca. Se desarrolla una propuesta sistemática con el fin de entender el concepto sobre la base intuitiva de que la calidad se relaciona con lo bien que funcionan las cosas para un fin determinado. El análisis se basa en el hecho de que cualquier uso del concepto de calidad supone que hay actores que realizan una acción con la ayuda de un medio. En consecuencia, la calidad es un tipo particular de relación entre medios y fines. En términos generales, la calidad de un medio es su capacidad para mejorar las consecuencias esperadas de la acción. El análisis muestra cómo ésta conclusión puede entenderse en términos de preferencias multiatributo bajo condiciones de incertidumbre. Que las consecuencias sean mejores o no depende de suponer una relación de preferencias que debe ser correcta dados los propósitos y circunstancias de los actores, pero que puede ser distinta de las preferencias reales de muchos actores individuales. La calidad no es subjetiva (no cambia en función de los procesos psicológicos de un individuo en particular) ni objetiva (en cierto sentido, depende de la acción y la cognición), sino que es relativa a ciertas preferencias de referencia. En la tesis se estudia qué se considera un medio, cómo se relaciona con un fin, qué atributos son relevantes, cuándo las preferencias de referencia están bien formadas, y a qué tipo de medios tiene sentido aplicar el concepto. Como complemento, se presenta un modelo simple (construido a partir de propiedades de las funciones booleanas) sobre relaciones medios-fines. El concepto de calidad aparece en la gestión bajo dos formas interrelacionadas: (a) las actividades de las organizaciones para intervenir en la calidad de lo que utilizan y proporcionan, y (b) las iniciativas para competir a través de la calidad. (a) Las actividades básicas de la gestión de la calidad se examinan bajo la perspectiva del análisis del concepto: definición de criterios de calidad, diseño de productos, diseño de procesos, planificación operativa, control, estandarización, mejora del producto, mejora de procesos, y redefinición de las preferencias de referencia. (b) El papel de la calidad en la rentabilidad y la ventaja competitiva sostenibles depende de cómo la calidad se relaciona con las barreras de entrada. El trabajo trata diferentes formas en que la calidad puede interactuar con la diferenciación del producto, los efectos de aprendizaje, las economías de alcance, la reputación, los requisitos de capital, el acceso a canales de distribución, los efectos red, las barreras legales o las economías de escala. Se argumenta que no es fácil de construir ventajas competitivas sostenibles solamente sobre la base de la calidad; su papel complementario en otras estrategias competitivas tiene varios aspectos a considerar. Por último, se trata el ejemplo concreto de la calidad de los flujos de información (procesos que mueven información desde el entorno hasta las decisiones para modificarlo). Se estudian, y se ilustran mediante dos casos reales, los factores decisivos de su calidad: la coherencia y las asimetrías en la información. El ejemplo de la información tiene por objetivo mostrar la necesidad de un análisis del concepto de calidad más allá de exhortaciones sobre clientes, productos, percepciones y expectativas.

    L’objectiu de la tesi és analitzar el concepte de qualitat i discutir de forma unificada el seu paper tant en la direcció d'operacions com en el pensament estratègic. El treball argumenta en contra de l'opinió generalitzada de que la qualitat consisteix en satisfer les necessitats i expectatives del client de manera que la diferència entre percepcions i expectatives es redueixi. Es desenvolupa una proposta sistemàtica per tal d'entendre el concepte sobre la base intuïtiva de que la qualitat es relaciona amb com de bé funcionen les coses per una finalitat determinada. L'anàlisi es basa en el fet que qualsevol ús del concepte de qualitat suposa que hi ha actors que realitzen una acció amb l'ajuda d'un mitjà. En conseqüència, la qualitat és un tipus particular de relació entre mitjans i fins. En termes generals, la qualitat d'un mitjà és la seva capacitat per millorar les conseqüències esperades de l'acció. L'anàlisi mostra com aquesta conclusió es pot entendre en termes de preferències multiatribut sota condicions d'incertesa. Que les conseqüències siguin millors o no depèn de suposar una relació de preferències que ha de ser correcta donats els propòsits i circumstàncies dels actors, però que pot ser diferent de les preferències reals de molts actors individuals. La qualitat no és subjectiva (no canvia en funció dels processos psicològics d'un individu en particular) ni objectiva (en certa manera, depèn de l'acció i la cognició), sinó que és relativa a certes preferències de referència. En la tesi s'estudia què es considera un mitjà, com es relaciona amb un fi, quins atributs són rellevants, quan les preferències de referència estan ben formades, i a quin tipus de mitjans té sentit aplicar el concepte. Com a complement, es presenta un model simple (construït a partir de propietats de les funcions booleanes) sobre les relacions entre mitjans i fins. El concepte de qualitat apareix en la gestió sota dues formes interrelacionades: (a) les activitats de les organitzacions per intervenir en la qualitat d’allò que fan servir i proporcionen, i (b) les iniciatives per competir a través de la qualitat. (a) Les activitats bàsiques de la gestió de la qualitat s'examinen sota la perspectiva de l'anàlisi del concepte: definició de criteris de qualitat, disseny de productes, disseny de processos, planificació operativa, control, estandardització, millora del producte, millora de processos , i redefinició de les preferències de referència. (b) El paper de la qualitat en la rendibilitat i l'avantatge competitiu sostenibles depèn de com la qualitat es relaciona amb les barreres d'entrada. El treball tracta diferents formes en les que la qualitat pot interactuar amb la diferenciació del producte, els efectes d'aprenentatge, les economies d'abast, la reputació, els requisits de capital, l'accés a canals de distribució, els efectes xarxa, les barreres legals o les economies d'escala. S'argumenta que no és fàcil construir avantatges competitius sostenibles només sobre la base de la qualitat; el seu paper complementari en altres estratègies competitives té diversos aspectes a considerar. Finalment, es tracta l'exemple concret de la qualitat dels fluxos d'informació (processos que mouen informació des de l'entorn fins a les decisions per modificar). S'estudien, i s'il•lustren mitjançant dos casos reals, els factors decisius de la seva qualitat: la coherència i les asimetries en la informació. L'exemple de la informació té per objectiu mostrar la necessitat d'una anàlisi del concepte de qualitat més enllà d’exhortacions sobre clients, productes, percepcions i expectatives.

  • On vote switching, location and national divide in Catalonia

     Puig Oriol, Xavier; Ginebra Molins, Josep
    Date: 2012-11-27
    Report

     Share Reference managers Reference managers Open in new window

  • A Cluster Analysis of vote transitions

     Puig Oriol, Xavier; Ginebra Molins, Josep
    Date: 2012-12-17
    Report

     Share Reference managers Reference managers Open in new window

  • A bayesian analysis of the way in which voters switch their vote

     Puig Oriol, Xavier; Ginebra Molins, Josep
    Date: 2012-07-10
    Report

     Share Reference managers Reference managers Open in new window

  • Extended truncated Tweedie-Poisson model

     Valero Baya, Jordi; Ginebra Molins, Josep; Perez Casany, Marta
    Methodology and computing in applied probability
    Date of publication: 2012-03-05
    Journal article

    View View Open in new window  Share Reference managers Reference managers Open in new window

  • Statistical Methods in Kansei Engineering Studies  Open access

     Marco Almagro, Lluis
    Defense's date: 2011-12-15
    Department of Statistics and Operations Research, Universitat Politècnica de Catalunya
    Theses

    Read the abstract Read the abstract Access to the full text Access to the full text Open in new window  Share Reference managers Reference managers Open in new window

    Aquesta tesi doctoral tracta sobre Enginyeria Kansei (EK), una tècnica per traslladar emocions transmeses per productes en paràmetres tècnics, i sobre mètodes estadístics que poden beneficiar la disciplina. El propòsit bàsic de l'EK és descobrir de quina manera algunes propietats d'un producte transmeten certes emocions als seus usuaris. És un mètode quantitatiu, i les dades es recullen típicament fent servir qüestionaris. S'extreuen conclusions en analitzar les dades recollides, normalment usant algun tipus d'anàlisi de regressió. L'EK es pot situar en l'àrea de recerca del disseny emocional. La tesi comença justificant la importància del disseny emocional. Com que el rang de tècniques usades sota el nom d'EK és extens i no massa clar, la tesi proposa una definició d'EK que serveix per delimitar el seu abast. A continuació, es suggereix un model per desenvolupar estudis d'EK. El model inclou el desenvolupament de l'espai semàntic – el rang d'emocions que el producte pot transmetre – i l'espai de propietats – les variables tècniques que es poden modificar en la fase de disseny. Després de la recollida de dades, l'etapa de síntesi enllaça ambdós espais (descobreix com diferents propietats del producte transmeten certes emocions). Cada pas del model s'explica detalladament usant un estudi d'EK realitzat per aquesta tesi: l'experiment dels sucs de fruites. El model inicial es va millorant progressivament durant la tesi i les dades de l'experiment es van reanalitzant usant noves propostes.Moltes inquietuds pràctiques apareixen quan s'estudia el model per a estudis d'EK esmentat anteriorment (entre d'altres, quants participants són necessaris i com es desenvolupa la sessió de recollida de dades). S'ha realitzat una extensa revisió bibliogràfica amb l'objectiu de respondre aquestes i altres preguntes. Es descriuen també les aplicacions d'EK més habituals, juntament amb comentaris sobre idees particularment interessants de diferents articles. La revisió bibliogràfica serveix també per llistar quines són les eines més comunament utilitzades en la fase de síntesi.La part central de la tesi se centra precisament en les eines per a la fase de síntesi. Eines estadístiques com la teoria de quantificació tipus I o la regressió logística ordinal s'estudien amb detall, i es proposen diverses millores. En particular, es proposa una nova forma gràfica de representar els resultats d'una regressió logística ordinal. S'introdueix una tècnica d'aprenentatge automàtic, els conjunts difusos (rough sets), i s'inclou una discussió sobre la seva idoneïtat per a estudis d'EK. S'usen conjunts de dades simulades per avaluar el comportament de les eines estadístiques suggerides, la qual cosa dóna peu a proposar algunes recomanacions.Independentment de les eines d'anàlisi utilitzades en la fase de síntesi, les conclusions seran probablement errònies quan la matriu del disseny no és adequada. Es proposa un mètode per avaluar la idoneïtat de matrius de disseny basat en l'ús de dos nous indicadors: un índex d'ortogonalitat i un índex de confusió. S'estudia l'habitualment oblidat rol de les interaccions en els estudis d'EK i es proposa un mètode per incloure una interacció, juntament amb una forma gràfica de representar-la. Finalment, l'última part de la tesi es dedica a l'escassament tractat tema de la variabilitat en els estudis d'EK. Es proposen un mètode (basat en l'anàlisi clúster) per segmentar els participants segons les seves respostes emocionals i una forma d'ordenar els participants segons la seva coherència en valorar els productes (usant un coeficient de correlació intraclasse). Com que molts usuaris d'EK no són especialistes en la interpretació de sortides numèriques, s'inclouen representacions visuals per a aquests dos nous mètodes que faciliten el processament de les conclusions.

    Esta tesis doctoral trata sobre Ingeniería Kansei (IK), una técnica para trasladar emociones transmitidas por productos en parámetros técnicos, y sobre métodos estadísticos que pueden beneficiar la disciplina. El propósito básico de la IK es descubrir de qué manera algunas propiedades de un producto transmiten ciertas emociones a sus usuarios. Es un método cuantitativo, y los datos se recogen típicamente usando cuestionarios. Se extraen conclusiones al analizar los datos recogidos, normalmente usando algún tipo de análisis de regresión.La IK se puede situar en el área de investigación del diseño emocional. La tesis empieza justificando la importancia del diseño emocional. Como que el rango de técnicas usadas bajo el nombre de IK es extenso y no demasiado claro, la tesis propone una definición de IK que sirve para delimitar su alcance. A continuación, se sugiere un modelo para desarrollar estudios de IK. El modelo incluye el desarrollo del espacio semántico – el rango de emociones que el producto puede transmitir – y el espacio de propiedades – las variables técnicas que se pueden modificar en la fase de diseño. Después de la recogida de datos, la etapa de síntesis enlaza ambos espacios (descubre cómo distintas propiedades del producto transmiten ciertas emociones). Cada paso del modelo se explica detalladamente usando un estudio de IK realizado para esta tesis: el experimento de los zumos de frutas. El modelo inicial se va mejorando progresivamente durante la tesis y los datos del experimento se reanalizan usando nuevas propuestas. Muchas inquietudes prácticas aparecen cuando se estudia el modelo para estudios de IK mencionado anteriormente (entre otras, cuántos participantes son necesarios y cómo se desarrolla la sesión de recogida de datos). Se ha realizado una extensa revisión bibliográfica con el objetivo de responder éstas y otras preguntas. Se describen también las aplicaciones de IK más habituales, junto con comentarios sobre ideas particularmente interesantes de distintos artículos. La revisión bibliográfica sirve también para listar cuáles son las herramientas más comúnmente utilizadas en la fase de síntesis. La parte central de la tesis se centra precisamente en las herramientas para la fase de síntesis. Herramientas estadísticas como la teoría de cuantificación tipo I o la regresión logística ordinal se estudian con detalle, y se proponen varias mejoras. En particular, se propone una nueva forma gráfica de representar los resultados de una regresión logística ordinal. Se introduce una técnica de aprendizaje automático, los conjuntos difusos (rough sets), y se incluye una discusión sobre su idoneidad para estudios de IK. Se usan conjuntos de datos simulados para evaluar el comportamiento de las herramientas estadísticas sugeridas, lo que da pie a proponer algunas recomendaciones. Independientemente de las herramientas de análisis utilizadas en la fase de síntesis, las conclusiones serán probablemente erróneas cuando la matriz del diseño no es adecuada. Se propone un método para evaluar la idoneidad de matrices de diseño basado en el uso de dos nuevos indicadores: un índice de ortogonalidad y un índice de confusión. Se estudia el habitualmente olvidado rol de las interacciones en los estudios de IK y se propone un método para incluir una interacción, juntamente con una forma gráfica de representarla. Finalmente, la última parte de la tesis se dedica al escasamente tratado tema de la variabilidad en los estudios de IK. Se proponen un método (basado en el análisis clúster) para segmentar los participantes según sus respuestas emocionales y una forma de ordenar los participantes según su coherencia al valorar los productos (usando un coeficiente de correlación intraclase). Puesto que muchos usuarios de IK no son especialistas en la interpretación de salidas numéricas, se incluyen representaciones visuales para estos dos nuevos métodos que facilitan el procesamiento de las conclusiones.

    This PhD thesis deals with Kansei Engineering (KE), a technique for translating emotions elicited by products into technical parameters, and statistical methods that can benefit the discipline. The basic purpose of KE is discovering in which way some properties of a product convey certain emotions in its users. It is a quantitative method, and data are typically collected using questionnaires. Conclusions are reached when analyzing the collected data, normally using some kind of regression analysis. Kansei Engineering can be placed under the more general area of research of emotional design. The thesis starts justifying the importance of emotional design. As the range of techniques used under the name of Kansei Engineering is rather vast and not very clear, the thesis develops a detailed definition of KE that serves the purpose of delimiting its scope. A model for conducting KE studies is then suggested. The model includes spanning the semantic space – the whole range of emotions the product can elicit – and the space of properties – the technical variables that can be modified in the design phase. After the data collection, the synthesis phase links both spaces; that is, discovers how several properties of the product elicit certain emotions. Each step of the model is explained in detail using a KE study specially performed for this thesis: the fruit juice experiment. The initial model is progressively improved during the thesis and data from the experiment are reanalyzed using the new proposals. Many practical concerns arise when looking at the above mentioned model for KE studies (among many others, how many participants are used and how the data collection session is conducted). An extensive literature review is done with the aim of answering these and other questions. The most common applications of KE are also depicted, together with comments on particular interesting ideas from several papers. The literature review also serves to list which are the most common tools used in the synthesis phase. The central part of the thesis focuses precisely in tools for the synthesis phase. Statistical tools such as quantification theory type I and ordinal logistic regression are studied in detail, and several improvements are suggested. In particular, a new graphical way to represent results from an ordinal logistic regression is proposed. An automatic learning technique, rough sets, is introduced and a discussion is included on its adequacy for KE studies. Several sets of simulated data are used to assess the behavior of the suggested statistical techniques, leading to some useful recommendations. No matter the analysis tools used in the synthesis phase, conclusions are likely to be flawed when the design matrix is not appropriate. A method to evaluate the suitability of design matrices used in KE studies is proposed, based on the use of two new indicators: an orthogonality index and a confusion index. The commonly forgotten role of interactions in KE studies is studied and a method to include an interaction in KE studies is suggested, together with a way to represent it graphically. Finally, the untreated topic of variability in KE studies is tackled in the last part of the thesis. A method (based in cluster analysis) for finding segments among subjects according to their emotional responses and a way to rank subjects based on their coherence when rating products (using an intraclass correlation coefficient) are proposed. As many users of Kansei Engineering are not specialists in the interpretation of the numerical output from statistical techniques, visual representations for these two new proposals are included to aid understanding.

  • Estadística y probabilidad orientada al análisis de datos discreto

     Perez Casany, Marta; Puig Oriol, Xavier; Fontdecaba Rigat, Sara; Valero Baya, Jordi; Ginebra Molins, Josep; Delicado Useros, Pedro Francisco
    Participation in a competitive project

     Share

  • Análisis espacial de datos electorales. Aplicación al municipio de Barcelona

     Broner, Sonia Judith
    Defense's date: 2010-01-21
    Department of Statistics and Operations Research, Universitat Politècnica de Catalunya
    Theses

     Share Reference managers Reference managers Open in new window

  • Multinomial cluster analysis of electoral Data

     Puig Oriol, Xavier; Ginebra Molins, Josep
    Ninth Valencia International Meeting on Bayesian Satistics
    Presentation's date: 2010-06-06
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • On the measure and the estimation of evenness and diversity

     Ginebra Molins, Josep; Puig Oriol, Xavier
    Computational statistics and data analysis
    Date of publication: 2010
    Journal article

    Read the abstract Read the abstract View View Open in new window  Share Reference managers Reference managers Open in new window

    Modelling word or species frequency count data through zero truncated Poisson mixture models allows one to interpret the model mixing distribution as the distribution of the word or species frequencies of the vocabulary or population. As a consequence, estimates of their mixing density can be used as a fingerprint of the style of the author in his texts or of the ecosystem in its samples. Definitions of measure of the evenness and of measure of the diversity within a vocabulary or population are given, and the novelty of these definitions is explained. It is then proposed that the measures of the evenness and of the diversity of a vocabulary or population be approximated through the expectation of these measures under the word or species frequency distribution. That leads to the assessment of the lack of diversity through measures of the variability of the mixing frequency distribution estimates described above.

    Postprint (author’s final draft)

  • The Sichel Model and the mixing and truncation order

     Puig Oriol, Xavier; Ginebra Molins, Josep; Font Valverde, Marti
    Journal of Applied Statistics
    Date of publication: 2010
    Journal article

    Read the abstract Read the abstract View View Open in new window  Share Reference managers Reference managers Open in new window

    The analysis of word frequency count data can be very useful in authorship attribution problems. Zerotruncated generalized inverse Gaussian–Poisson mixture models are very helpful in the analysis of these kinds of data because their model-mixing density estimates can be used as estimates of the density of the word frequencies of the vocabulary. It is found that this model provides excellent fits for theword frequency counts of very long texts, where the truncated inverse Gaussian–Poisson special case fails because it does not allow for the large degree of over-dispersion in the data. The role played by the three parameters of this truncated GIG-Poisson model is also explored. Our second goal is to compare the fit of the truncated GIG-Poisson mixture model with the fit of the model that results from switching the order of the mixing and truncation stages. A heuristic interpretation of the mixing distribution estimates obtained under this alternative GIG-truncated Poisson mixture model is also provided.

  • Medida de la información en un experimento de la familia exponencial

     Rodero De Lamo, Lourdes
    Defense's date: 2010-06-25
    Department of Statistics and Operations Research, Universitat Politècnica de Catalunya
    Theses

     Share Reference managers Reference managers Open in new window

  • ANALISIS DE DATOS COMPLEJOS

     Puig Oriol, Xavier; Ginebra Molins, Josep; Fontdecaba Rigat, Sara; Valero Baya, Jordi; Riba Civil, Alexandre; Font Valverde, Marti; Rodero De Lamo, Lourdes; Delicado Useros, Pedro Francisco
    Participation in a competitive project

     Share

  • On the measure and the estimation of the evenness and diversity of vocabulary

     Ginebra Molins, Josep; Puig Oriol, Xavier
    Computational statistics and data analysis
    Date of publication: 2010
    Journal article

    Read the abstract Read the abstract View View Open in new window  Share Reference managers Reference managers Open in new window

    Modelling word or species frequency count data through zero truncated Poisson mixture models allows one to interpret the model mixing distribution as the distribution of the word or species frequencies of the vocabulary or population. As a consequence, estimates of their mixing density can be used as a fingerprint of the style of the author in his texts or of the ecosystem in its samples. Definitions of measure of the evenness and of measure of the diversity within a vocabulary or population are given, and the novelty of these definitions is explained. It is then proposed that the measures of the evenness and of the diversity of a vocabulary or population be approximated through the expectation of these measures under the word or species frequency distribution. That leads to the assessment of the lack of diversity through measures of the variability of the mixing frequency distribution estimates described above.

  • On zero-truncating and mixing Poisson distributions

     Valero Baya, Jordi; Perez Casany, Marta; Ginebra Molins, Josep
    Advances in applied probability
    Date of publication: 2010
    Journal article

    View View Open in new window  Share Reference managers Reference managers Open in new window

  • Extended truncated inverse Gaussian-Poisson model

     Puig Oriol, Xavier; Ginebra Molins, Josep; Perez Casany, Marta
    Statistical modeling
    Date of publication: 2009
    Journal article

     Share Reference managers Reference managers Open in new window

  • GEOSTATISTICAL ANALYSIS OF FUNCTIONAL DATA

     Giraldo, Ramon
    Defense's date: 2009-07-01
    Department of Statistics and Operations Research, Universitat Politècnica de Catalunya
    Theses

     Share Reference managers Reference managers Open in new window

  • Anàlisi de dades discretes: freqüència de freqüències i dades multinomials

     Puig Oriol, Xavier
    Defense's date: 2009-12-18
    Department of Statistics and Operations Research, Universitat Politècnica de Catalunya
    Theses

     Share Reference managers Reference managers Open in new window

  • The Extension of the Parameter Space of the Zero-Truncated Poisson-Gaussian Inverse Distribution

     Ginebra Molins, Josep
    2nd International Conference on mathematics & statistics
    Presentation's date: 2008-06-16
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • Access to the full text
    Anàlisi de la mortalitat per tumors malignes de mama i d'estómac a Catalunya  Open access

     Puig Oriol, Xavier; Ginebra Molins, Josep
    Date of publication: 2008
    Book chapter

    Read the abstract Read the abstract Access to the full text Access to the full text Open in new window  Share Reference managers Reference managers Open in new window

    Les diferències en la distribució geogràfica de les causes de mortalitat són una informació de gran interès per lluitar contra elles. Les primeres hipòtesis sobre les causes de moltes malalties han estat establertes a partir de la identificació d’una major freqüència d’aparició en àmbits geogràfics on hi ha presència o absència de certs factors, siguin tipus d’hàbits, alimentació, exposicions ambientals o d’altres. A més, conèixer el patró de distribució geogràfica de qualsevol causa de mort ja té valor per ell mateix, ja que pot servir de base per a la presa de decisions en l’àmbit de la gestió sanitària i salut pública, mostrant les àrees on és més prioritari intervenir, així com avaluar l’efectivitat d’algunes intervencions o programes sanitaris implantats en les diferents àrees. Per altra banda, conèixer l’evolució al llarg del temps de les causes de mortalitat aporta també una informació valuosa per identificar tendències, planificar recursos i, també, per avaluar els resultats de les accions que es van desenvolupant.

  • Distribución geográfica de la mortalidad por infarto agudo de miocardio en España

     Puig Oriol, Xavier; Gispert, Rosa; Tresserras, Ricard; Ginebra Molins, Josep
    IV Jornadas Científicas de las Sociedades Españolas de Epidemiología y Biometría.
    Presentation's date: 2008-06-19
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • The Extension of the Parameter Space of the Zero-Truncated Poisson-Gaussian Inverse Distribution

     Perez Casany, Marta; Puig Oriol, Xavier; Ginebra Molins, Josep
    2nd International Conference on mathematics & statistics
    Presentation's date: 2008
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • Bayesian Smoothing of Micro Array's Copy Number Data

     Puig Oriol, Xavier; Ginebra Molins, Josep; Beà, Sílvia
    XXIVth International Biometric Conference
    Presentation's date: 2008-07-13
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • Sample size determination for 2k-r experiments with a binomial response

     González Dávila, Enrique; Ginebra Molins, Josep; Dorta Guerra, Roberto
    Journal of Applied Statistics
    Date of publication: 2008-01
    Journal article

     Share Reference managers Reference managers Open in new window

  • One-half fractions of a 2^3 experiment for the logistic model

     Ginebra Molins, Josep
    8th International Workshop in Model-Oriented Design and Analysis
    Presentation's date: 2007-06-04
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • One-half fractions of a 2^3 experiment for the logistic model

     Ginebra Molins, Josep
    Date of publication: 2007-07-31
    Book chapter

     Share Reference managers Reference managers Open in new window

  • Proceedings of the 8th International Workshop in Model-Oriented Design and Analysis (MODA 8)

     Ginebra Molins, Josep
    8th International Workshop in Model-Oriented Design and Analysis
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • Diseños factoriales D-óptimos en modelos de Poisson aplicados a problemas de toxicidad.

     Ginebra Molins, Josep
    Congreso Nacional de Estadística e Investigación Operativa
    Presentation's date: 2007-09-25
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • Bayesian modelling of the vocabulary distribution

     Ginebra Molins, Josep
    Case Studies in Bayesian Statistics Workshop 9
    Presentation's date: 2007-10-19
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • Bayesian Modeling of Vocabulary Distributions

     Font, Martí; Ginebra Molins, Josep; Puig Oriol, Xavier
    Case Studies in Bayesian Statistics Workshop 9
    Presentation's date: 2007-10-19
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • On the information in two-level experiments

     González-Dávila, Enrique; Ginebra Molins, Josep; Dorta Guerra, Roberto
    Model assisted statistics and applications
    Date of publication: 2007-09
    Journal article

     Share Reference managers Reference managers Open in new window

  • Simulation-Based Designs for Multiperiod Control

     González Dávila, Enrique; Dorta Guerra, Roberto; Ginebra Molins, Josep
    Computational statistics and data analysis
    Date of publication: 2007-05
    Journal article

    View View Open in new window  Share Reference managers Reference managers Open in new window

  • On the measure of the information in a statistical experiment

     Ginebra Molins, Josep
    The journal - Bayesian analysis (Online)
    Date of publication: 2007-01
    Journal article

    View View Open in new window  Share Reference managers Reference managers Open in new window

  • An integrated analysis of individual and aggregated health data using estimating equations

     Martínez Martínez, José Miguel; Benach de Rovira, Joan; Ginebra Molins, Josep; Benavides, Fernando G.; Yasui, Yutaka
    The international journal of biostatistics
    Date of publication: 2007-02
    Journal article

    View View Open in new window  Share Reference managers Reference managers Open in new window

  • Mortalidad por cáncer de estómago en Cataluña: distribución geográfica y evolución temporal entre 1986 y 2000

     Puig Oriol, Xavier; Gispert, Rosa; Ginebra Molins, Josep
    Medicina clínica
    Date of publication: 2006-04
    Journal article

     Share Reference managers Reference managers Open in new window

  • Principios de metodología de superficie de respuesta para modelos logísticos  Open access

     TARSICIO DE ZAN, ARTURO
    Defense's date: 2006-05-12
    Department of Statistics and Operations Research, Universitat Politècnica de Catalunya
    Theses

    Read the abstract Read the abstract Access to the full text Access to the full text Open in new window  Share Reference managers Reference managers Open in new window

    En esta tesis doctoral abordamos algunos principios para estudiar la Metodología de Superficie de Respuesta (que abreviaremos en adelante como MSR) para datos que siguen distribuciones binarias (Bernoulli y binomial), y que se ajustan mediante Modelos Lineales Generalizados (que abreviaremos como MLG). El punto de partida elegido ha sido el enfoque clásico de la MSR, es decir, en el contexto de modelos lineales y normales y, en particular, a partir del trabajo seminal de Box y Wilson (1951).Nuestra pregunta de investigación alrededor de la cual hemos elaborado este trabajo gira alrededor del siguiente planteamiento: "¿cómo podría proceder el experimentador cuando la naturaleza de su proceso no sigue los supuestos clásicos de normalidad y linealidad?". Enlazando esta cuestión con el estado actual del arte en materia de la MSR, una segunda pregunta fue: "¿Cómo podría ser un proceso secuencial de aprendizaje del funcionamiento de un sistema en los que intervengan respuestas de naturaleza binaria en el que se persiga un objetivo determinado?". Para poder investigar con mayor profundidad esta pregunta, y mediante un sustento metodológico lo suficientemente sólido, nos apoyamos en los MLG. Estos modelos -a partir de su primera presentación y formulación en el trabajo de Nelder y Wedderburn (1972)- son la herramienta que elegimos para encontrar una metodología de aplicación sistemática, que nos permita buscar modelos adecuados que puedan ajustar respuestas de naturaleza binaria. Consideramos como estrategia particular aquella en la que se encontraría el experimentador cuando dispone de un número fijo de observaciones a realizar de las variables de un sistema, que traducimos con el nombre de "estrategia de presupuesto fijo". Así, el objetivo será poder cuantificar de alguna forma la ganancia de información que alcanzamos a conocer del proceso luego de haber utilizado todo el presupuesto disponible. En todos los casos nuestro plan es el de utilizar familias de estrategias de diseños factoriales a dos niveles, secuencialmente encadenados. Nuestro estudio comienza definiendo una familia de estrategias de exploración de un proceso representado por una superficie de respuesta teórica binaria, en la que hemos identificado tres variables: un valor llamado w, acotado entre 0 y 1, el cual es utilizado para definir el primer centro de experimentación. Luego, se considera una segunda variable, que será el valor que tenga el rango de variación de los factores, L, y finalmente, cuando se ensayen nuevas alternativas de puntos de diseño, habrá un valor S, que llamaremos "salto", que representará la longitud que separa un centro de diseño del siguiente. De esta manera, diremos que una estrategia de diseño queda caracterizada por los valores L, S y w. Partiendo así de una superficie de respuesta que sea la que mejor se considera que se aproxima a un proceso real, el objetivo será el de encontrar a través de simulaciones los niveles de w, L y S que alcancen los mejores valores posibles bajo dos criterios de selección de diseños: (a) una basada en el determinante de la Matriz de Información de Fisher (que hemos llamado "criterio de la cantidad de información"), y (b) el otro, basado en el valor de la superficie teórica evaluado en las mejores condiciones que se obtengan del modelo ajustado (que hemos llamado "criterio de proximidad al máximo"). A tal efecto, hemos utilizado programas escritos en el lenguaje R (www.r-project.orq), un entorno de programación potente y flexible,La completa revisión bibliográfica de ambos temas (MSR y MLG), junto con el diseño de herramientas informáticas "ad-hoc", ofrecen un enfoque novedoso y origina! que puede servir como punto de partida para continuar buscando el enlace entre estas dos metodologías y su aplicación en problemas prácticos sobre la base de criterios objetivos que puedan soportar la toma de decisiones.

    In this PhD thesis we approached some principles that relate to the study the Response Surface Methodology (abbreviated as RSM) for binary responses (Bernoulli and binomial distributions), modellable through the scope of Generalized Linear Models (abbreviated as GLM}. Our starting point is the classic approach of the RSM, in the context of linear normal models and, particularly, from the seminal work on the subject, by the article of Box and Wilson (1951). Our first research question from which we started ellaborating this work was around of the following statement: "How could experimenters deal with this problem when the nature of the process does not follow the classical assumptions of normality and linearity?". Connecting this question with the present state-of-the-art in RSM, the second question that we address is: "How could one design a sequential strategy to learn about the operation of a system with binary response, when certain objectives are persecuted?". In order to explore these questions deeper by means of a methodological support, we leaned towards the GLM approach. These models -presented and formulated primarily in the work of Nelder and Wedderburn (1972)- are the tool that we have chosen in order to find a systematic applied methodology, that aims for suitable models that can be fitted to binary response.We consider as a particular strategy, the one in which the experimenter has a fixed number of observations to be made, in what we labeled as "strategy of fixed budget". Thus, the objective will be to quantify the information gain once we have used all the budget available. In both cases, our plan is to carry out 2-level factorial and sequential designs. Our approach starts with a definition of a family of design strategies for exploration of a process that is being represented by a certain response surface. These strategies are characterized though three variables: w, bounded between 0 and 1, used to define the first experimentation center point. Once that is determined, a second variable is considered: L, or the range of variation of the factors. Finally, when several experimental conditions were considered, the variable S, identifies the jump length that connects one center point of experimentation with the following one, Having defined the scope this way, we can say that a design strategy may be characterized by means of a three-variable picture: L, S and w. Once the experimenter defined what kind of response surface is the best one to approach the real process, the goal will be to find the levels of L, S and w that maximizes the value of two alternative criteria: the first one is based on the determinant of the Fisher's Information Matrix, and it captures (he amount of information gathered by the design, and the second one is the value taken by the theoretical surface on the maximum of the fitted surface. In order to this scope, we have written some programs in R language (www.r-proiect.org), a powerful and flexible environment of programming and doing statistics.A complete bibliographical review of both topics (RSM and GLM), as well as the design of "ad-hoc" specific software, try to offer a new and an original point of view to study this problem, which maybe useful as a starting point for continuing the research in these areas and the link between these two methodologies. It is of special interest the exploration of new practical applications to real problems based on some objective criteria that can support the process of decision making.

  • Statistical Applications in Geographical Health Studies  Open access

     Martinez Martinez, Jose Miguel
    Defense's date: 2006-07-25
    Department of Statistics and Operations Research, Universitat Politècnica de Catalunya
    Theses

    Read the abstract Read the abstract Access to the full text Access to the full text Open in new window  Share Reference managers Reference managers Open in new window

    Aquesta tesi està formada per dues parts relacionades amb l'estudi de la salut d'una regió geogràfica dividida en un conjunt de zones (àrees petites). La primera part es basa en un estudi amb informació de salut agregada per cadascuna de les àrees que formen la regió d'estudi. En concret, es tracta d'una aplicació de mapes de salut (disease mapping), que utilitza mètodes Bayesians empírics per generar un Atles de mortalitat en àrees petites de Catalunya en el període 1984-1998. La segona part utilitza una nova perspectiva basada en la integració de les dades agregades i individuals de salut per cadascuna de les zones que formen la regió d'estudi, mitjançant equacions d'estimació (estimating equations). Aquesta nova perspectiva és una extensió de la regressió geogràfica.L'elaboració de la primera part d'aquesta tesi està justificada per diferents raons. En primer lloc, els atles de salut i en general els mapes d'indicadors de salut, ens han mostrat la seva gran utilitat per identificar les localitzacions geogràfiques de les malalties, formular hipòtesis sobre les causes de la malaltia i monitoritzar intervencions en salut pública. En segon lloc, els atles de mortalitat en àrees petites presenten la distribució del risc relatiu per les causes de mortalitat més importants utilitzant mapes amb un alt nivell de resolució geogràfica.El primer objectiu d'aquesta tesi va ser construir un atles de mortalitat en 289 àrees petites (municipis o municipis agregats) de la Comunitat Autònoma de Catalunya i 66 àrees bàsiques de salut de la ciutat de Barcelona (l'àrea petita analitzada amb una major població) per al període 1984-1998. Per obtenir els indicadors de salut en àrees petites s'han utilitzat mètodes Bayesians. Aquests mapes presenten, en un format de doble pàgina, els riscs relatius ajustats per edat, les àrees significatives d'alt i baix risc, el risc relatiu de la ciutat de Barcelona respecte a Catalunya i internament respecte a Barcelona, el risc relatiu per grups d'edat (0-64 i 65) i addicionalment l'evolució temporal del risc relatiu en cada àrea resumida en un únic mapa. En concret, per estudiar l'evolució del risc relatiu de mortalitat s'inclou: 1) l'evolució del risc relatiu en el període d'estudi de cada àrea comparada amb la tendència global de Catalunya i 2) l'evolució absoluta del risc relatiu a cada àrea. Segons el nostre coneixement, aquesta és la primera vegada que aquests dos tipus d'informació es combinen en un únic mapa. A més, aquest és el primer Atles que presenta informació sobre la distribució geogràfica de zones que formen àrees petites de gran població, com ciutats d'un país, i inclou l'esperança de vida obtinguda amb mètodes Bayesians empírics.La segona part d'aquesta tesi és útil per estudis epidemiològics on s'inclouen variables d'exposició i confusió que poden tenir diferents fonts de variabilitat (variabilitat dins les poblacions i entre les poblacions). Específicament, els anàlisis individuals que valoren la relació entre la malaltia i l'exposició dins d'una població són útils quan l'exposició presenta variabilitat dins la població. Quan aquesta variabilitat és limitada, la força dels anàlisis individuals es debilita. En aquesta situació, un anàlisis de dades agregades de la malaltia entre poblacions, amb una mostra de dades individuals d'exposició, pot ser eficaç en l'estimació de l'efecte d'exposició si aquest presenta gran variabilitat entre poblacions. No obstant, encara que es pugui conèixer quina de les dues variacions domina en la variable d'exposició, es poden considerar conjuntament variables d'exposició i/o confusió amb diferents tipus de variació. El segon objectiu d'aquesta tesi va ser considerar una nova perspectiva, combinació dels anàlisis de dades individuals i agregades, basat en equacions d'estimació (perspectiva population-based estimating equation (PBEE)). En funció de la variabilitat que domina en la exposició, la anàlisis proposada pren força de la perspectiva basada en dades individuals i agrades de salut, per estimar els efectes d'exposició. Es van realitzar estudis de simulació en diferents escenaris per a mostrar el poder de la perspectiva proposada en l'estimació dels efectes d'exposició d'interès.Finalment, esperem que els mètodes i els diferents aspectes utilitzats en aquesta tesi puguin ser d'utilitat per a aquells investigadors que vulguin millorar l'estudi de la salut a l'espai i temps.

    Esta tesis esta formada por dos partes relacionadas con el estudio de la salud en una región geográfica dividida en un conjunto de zonas (áreas pequeñas). La primera parte considera un estudio con información de salud agregada para cada una de las áreas que forman la región analizada. En concreto, se trata de una aplicación de mapas de salud (disease mapping), consistente en el uso de métodos Bayesianos empíricos para generar un Atlas de mortalidad en áreas pequeñas de Cataluña en el periodo 1984-1998. La segunda parte considera un nuevo enfoque que realiza una integración de los datos agregados e individuales de salud para cada una de las zonas que forman la región en estudio, mediante ecuaciones de estimación (estimating equations). Se considera que este nuevo enfoque es una extensión de la regresión geográfica. La elaboración de la primera parte de esta tesis esta justificada por diferentes razones. Primero, los atlas de salud y en general los mapas de indicadores de salud, han mostrado su gran utilidad para identificar localizaciones geográficas de las enfermedades, formular hipótesis sobre las causas de la enfermedad y monitorizar intervenciones en salud pública. En segundo lugar, los atlas de mortalidad en áreas pequeñas presentan la distribución del riesgo relativo para las causas de mortalidad más importantes usando mapas con un alto nivel de resolución geográfica. El primer objetivo de esta tesis fue construir un atlas de mortalidad en 289 áreas pequeñas (municipios o municipios agregados) de la Comunidad Autónoma de Cataluña y 66 áreas básicas de salud de la ciudad de Barcelona (el área pequeña analizada con mayor población) para el periodo 1984-1998. Para obtener los indicadores de salud en las áreas pequeñas se han aplicado métodos Bayesianos. Estos mapas presentan, en un formato de página doble, los riesgos relativos ajustados por edad, las áreas significativas de alto y bajo riesgo, el riesgo relativo de la ciudad de Barcelona con respecto a Cataluña e internamente con respecto a Barcelona, el riesgo relativo por grupos de edad (0-64 y 65) y adicionalmente la evolución temporal del riesgo relativo en cada área resumida en un único mapa. En concreto, para estudiar la evolución del riesgo relativo de mortalidad se incluye: 1) la evolución del riesgo relativo en el periodo de estudio de cada área comparada con la tendencia global de Cataluña y 2) la evolución absoluta del riesgo relativo en cada área. Según nuestro conocimiento, esta es la primera vez que ambos tipos de información se combinan en un único mapa. Además, este es el primer Atlas que presenta información sobre la distribución geográfica de zonas que forman áreas pequeñas de gran población, como ciudades de un país, e incluye la esperanza de vida obtenida mediante métodos Bayesianos empíricos. La segunda parte de esta tesis es útil en estudios epidemiológicos donde se incluyen variables de exposición y confusión que pueden tener diferentes fuentes de variabilidad (variabilidad dentro de las poblaciones y entre poblaciones). Específicamente, los análisis individuales que valoran la relación entre enfermedad y exposición dentro de una población son útiles cuando la exposición presenta variabilidad dentro de la población. Cuando dicha variabilidad es limitada el poder de los análisis individuales se reduce. En esta situación, un análisis de datos agregados de enfermedad entre poblaciones, con una muestra de datos individuales de exposición, puede ser eficaz en la estimación del efecto de exposición si este presenta gran variabilidad entre poblaciones. No obstante, aunque se pueda conocer cual de las dos variaciones domina en la variable de exposición, se pueden considerar conjuntamente variables de exposición y/o confusión con diferentes tipos de variación. El segundo objetivo de esta tesis fue considerar un nuevo enfoque, combinación de los análisis de datos individuales y agregados, basado en ecuaciones de estimación (enfoque population-based estimating equation (PBEE)). Dependiendo de la variabilidad que domina en dicha exposición, el análisis propuesto toma fuerza de los enfoques basados en datos individuales y agregados de salud, para estimar los efectos de exposición. Estudios de simulación bajo diferentes escenarios fueron realizados para mostrar el poder del enfoque propuesto en la estimación de los efectos de exposición de interés.Finalmente, esperamos que los métodos y diferentes aspectos empleados en esta tesis puedan ser de utilidad para aquellos investigadores que quieran mejorar el estudio de la salud en el espacio y en el tiempo.

    This thesis consists of two related parts based on the study of health in a geographical region divided in a set of zones (small areas). The first part considers studies based on health information aggregated for each area into which the region under study has been divided. Specifically, it is a disease mapping application, based on generation of an Atlas of mortality in small areas of Catalonia over the period 1984-1998, using empirical Bayes methods. The second part considers an innovative approach, based on an integration of aggregated and individual health data in each of the zones of the region under study, using an estimating equation approach. Specifically, we consider this new approach as an extension of geographical regression. The elaboration of the first part of this thesis is justified for different reasons. First, health atlases and the mapping of health indicators in general, has demonstrated its great utility in identifying geographical localizations of health problems, in formulation of hypotheses about disease causes, and in monitoring public health interventions. Second, most atlases of mortality at the small area level present patterns of relative mortality risk for the most important causes of death using maps with a high level of geographical resolution. The first goal of this thesis was to construct a mortality Atlas involving a decomposition of the Autonomous Community of Catalonia into 289 small areas (municipalities or aggregates thereof) and 66 primary health areas of Barcelona city (being a small area but with a large population) for the period 1984-1998. For Catalonia as a whole, these maps presented, using a double-page format, the age adjusted relative risk, significantly high and low relative risk areas, relative risk in Barcelona City with respect to Catalonia and internally with respect to Barcelona, relative risk by age group (0-64 and 65) and additionally the relative risk evolution over time in each area summarized in an single map, using spatial and temporal information modeled through Bayesian methods. Specifically, the atlas uses a strategy to include both: 1) relative risk evolution throughout the study period of each area compared to the average trend for all Catalonia and 2) the absolute relative risk evolution of each area. To our knowledge, this is the first time that both types of information have been combined in a single map. In addition, this is the first Atlas that presents information about geographical patterns in zones within small areas having a large population such as the cities of a country and includes life expectancy obtained with an empirical Bayes approach.The second part of this thesis can be useful in epidemiological studies where we include exposure and confounding variables that may have different sources of within and between-population variability. Specifically, analyses of individual disease-exposure data within a population are useful when exposure of interest varies sufficiently within the population. When the within-population variance of exposure is limited power of the individual-data analysis within a population is reduced. In such situations, aggregated-data analyses of disease data across populations, with a sample of individual exposure data from populations, can be powerful in estimating the exposure effect if between-population variation of exposure is large. However, although we may have knowledge of which variations dominate in each variable, exposure and/or confounding variables with different types of variation can be considered jointly. The second goal of this thesis was to consider a new analytical framework that is a combination of the individual- and aggregated-data analyses, based on an estimating equation approach ("population-based estimating equation" (PBEE) approach). The proposed analysis utilizes strengths from individual and aggregated health data approaches in the estimation of the exposure effect of interest, depending on which of the exposure variations (within- vs. between-population) dominates. Simulation studies under different scenarios were performed to show the strengths of the proposed approach in the estimation of the exposure effects of interest.Finally, we hope that some of the methods and topics employed may be of use to researchers who want to improve the study of health in space and time.

  • Distribución geográfica y temporal de la mortalidad por cáncer de estómago en Cataluña, 1986-2000

     Ginebra Molins, Josep
    Congreso Nacional de Estadística e Investigación Operativa
    Presentation's date: 2006-05-15
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • Determinante de la matriz de información de Fisher y su aditividad

     Ginebra Molins, Josep
    Congreso Nacional de Estadística e Investigación Operativa
    Presentation's date: 2006-05-15
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • Determinación del tamaño muestral mediante técnicas Bayesianas

     Ginebra Molins, Josep
    Congreso Nacional de Estadística e Investigación Operativa
    Presentation's date: 2006-05-15
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • Diseños factoriales D-optimos a dos niveles para modelos de Poisson

     Guerra, Dorta; González, Dávila; Ginebra Molins, Josep
    Congreso Nacional de Estadística e Investigación Operativa
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window

  • Diseños factoriales D-optimos a dos niveles para modelos de Poisson

     Ginebra Molins, Josep
    Congreso Nacional de Estadística e Investigación Operativa
    Presentation's date: 2006-05-15
    Presentation of work at congresses

     Share Reference managers Reference managers Open in new window