Whamcloud - gitweb
LU-1347 style: removes obsolete EXPORT_SYMTAB macros
[fs/lustre-release.git] / lustre / mdd / mdd_lov.c
1 /*
2  * GPL HEADER START
3  *
4  * DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
5  *
6  * This program is free software; you can redistribute it and/or modify
7  * it under the terms of the GNU General Public License version 2 only,
8  * as published by the Free Software Foundation.
9  *
10  * This program is distributed in the hope that it will be useful, but
11  * WITHOUT ANY WARRANTY; without even the implied warranty of
12  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13  * General Public License version 2 for more details (a copy is included
14  * in the LICENSE file that accompanied this code).
15  *
16  * You should have received a copy of the GNU General Public License
17  * version 2 along with this program; If not, see
18  * http://www.sun.com/software/products/lustre/docs/GPLv2.pdf
19  *
20  * Please contact Sun Microsystems, Inc., 4150 Network Circle, Santa Clara,
21  * CA 95054 USA or visit www.sun.com if you need additional information or
22  * have any questions.
23  *
24  * GPL HEADER END
25  */
26 /*
27  * Copyright (c) 2007, 2010, Oracle and/or its affiliates. All rights reserved.
28  * Use is subject to license terms.
29  *
30  * Copyright (c) 2011, 2012, Whamcloud, Inc.
31  */
32 /*
33  * This file is part of Lustre, http://www.lustre.org/
34  * Lustre is a trademark of Sun Microsystems, Inc.
35  *
36  * lustre/mdd/mdd_lov.c
37  *
38  * Lustre Metadata Server (mds) handling of striped file data
39  *
40  * Author: Peter Braam <braam@clusterfs.com>
41  * Author: wangdi <wangdi@clusterfs.com>
42  */
43
44 #define DEBUG_SUBSYSTEM S_MDS
45
46 #include <linux/module.h>
47 #include <obd.h>
48 #include <obd_class.h>
49 #include <lustre_ver.h>
50 #include <obd_support.h>
51 #include <obd_lov.h>
52 #include <lprocfs_status.h>
53 #include <lustre_mds.h>
54 #include <lustre_fid.h>
55 #include <lustre/lustre_idl.h>
56
57 #include "mdd_internal.h"
58
59 static int mdd_notify(struct obd_device *host, struct obd_device *watched,
60                       enum obd_notify_event ev, void *owner, void *data)
61 {
62         struct mdd_device *mdd = owner;
63         int rc = 0;
64         ENTRY;
65
66         LASSERT(owner != NULL);
67         switch (ev)
68         {
69                 case OBD_NOTIFY_ACTIVE:
70                 case OBD_NOTIFY_SYNC:
71                 case OBD_NOTIFY_SYNC_NONBLOCK:
72                         rc = md_do_upcall(NULL, &mdd->mdd_md_dev,
73                                           MD_LOV_SYNC, data);
74                         break;
75                 case OBD_NOTIFY_CONFIG:
76                         rc = md_do_upcall(NULL, &mdd->mdd_md_dev,
77                                           MD_LOV_CONFIG, data);
78                         break;
79 #ifdef HAVE_QUOTA_SUPPORT
80                 case OBD_NOTIFY_QUOTA:
81                         rc = md_do_upcall(NULL, &mdd->mdd_md_dev,
82                                           MD_LOV_QUOTA, data);
83                         break;
84 #endif
85                 default:
86                         CDEBUG(D_INFO, "Unhandled notification %#x\n", ev);
87         }
88
89         RETURN(rc);
90 }
91
92 /* The obd is created for handling data stack for mdd */
93 int mdd_init_obd(const struct lu_env *env, struct mdd_device *mdd,
94                  struct lustre_cfg *cfg)
95 {
96         char                   *dev = lustre_cfg_string(cfg, 0);
97         int                     rc, name_size, uuid_size;
98         char                   *name, *uuid;
99         __u32                   mds_id;
100         struct lustre_cfg_bufs *bufs;
101         struct lustre_cfg      *lcfg;
102         struct obd_device      *obd;
103         ENTRY;
104
105         mds_id = lu_site2md(mdd2lu_dev(mdd)->ld_site)->ms_node_id;
106         name_size = strlen(MDD_OBD_NAME) + 35;
107         uuid_size = strlen(MDD_OBD_UUID) + 35;
108
109         OBD_ALLOC(name, name_size);
110         OBD_ALLOC(uuid, uuid_size);
111         if (name == NULL || uuid == NULL)
112                 GOTO(cleanup_mem, rc = -ENOMEM);
113
114         OBD_ALLOC_PTR(bufs);
115         if (!bufs)
116                 GOTO(cleanup_mem, rc = -ENOMEM);
117
118         snprintf(name, strlen(MDD_OBD_NAME) + 35, "%s-%s",
119                  MDD_OBD_NAME, dev);
120
121         snprintf(uuid, strlen(MDD_OBD_UUID) + 35, "%s-%s",
122                  MDD_OBD_UUID, dev);
123
124         lustre_cfg_bufs_reset(bufs, name);
125         lustre_cfg_bufs_set_string(bufs, 1, MDD_OBD_TYPE);
126         lustre_cfg_bufs_set_string(bufs, 2, uuid);
127         lustre_cfg_bufs_set_string(bufs, 3, (char*)dev/* MDD_OBD_PROFILE */);
128         lustre_cfg_bufs_set_string(bufs, 4, (char*)dev);
129
130         lcfg = lustre_cfg_new(LCFG_ATTACH, bufs);
131         OBD_FREE_PTR(bufs);
132         if (!lcfg)
133                 GOTO(cleanup_mem, rc = -ENOMEM);
134
135         rc = class_attach(lcfg);
136         if (rc)
137                 GOTO(lcfg_cleanup, rc);
138
139         obd = class_name2obd(name);
140         if (!obd) {
141                 CERROR("Can not find obd %s\n", MDD_OBD_NAME);
142                 LBUG();
143         }
144
145         cfs_spin_lock(&obd->obd_dev_lock);
146         obd->obd_recovering = 1;
147         cfs_spin_unlock(&obd->obd_dev_lock);
148         obd->u.mds.mds_id = mds_id;
149         obd->u.obt.obt_osd_properties.osd_max_ea_size =
150                                                mdd->mdd_dt_conf.ddp_max_ea_size;
151
152         rc = class_setup(obd, lcfg);
153         if (rc)
154                 GOTO(class_detach, rc);
155
156         /*
157          * Add here for obd notify mechanism, when adding a new ost, the mds
158          * will notify this mdd. The mds will be used for quota also.
159          */
160         obd->obd_upcall.onu_upcall = mdd_notify;
161         obd->obd_upcall.onu_owner = mdd;
162         mdd->mdd_obd_dev = obd;
163
164         EXIT;
165 class_detach:
166         if (rc)
167                 class_detach(obd, lcfg);
168 lcfg_cleanup:
169         lustre_cfg_free(lcfg);
170 cleanup_mem:
171         if (name)
172                 OBD_FREE(name, name_size);
173         if (uuid)
174                 OBD_FREE(uuid, uuid_size);
175         return rc;
176 }
177
178 int mdd_fini_obd(const struct lu_env *env, struct mdd_device *mdd,
179                  struct lustre_cfg *lcfg)
180 {
181         struct obd_device      *obd;
182         int rc;
183         ENTRY;
184
185         obd = mdd2obd_dev(mdd);
186         LASSERT(obd);
187
188         rc = class_cleanup(obd, lcfg);
189         if (rc)
190                 GOTO(lcfg_cleanup, rc);
191
192         obd->obd_upcall.onu_upcall = NULL;
193         obd->obd_upcall.onu_owner = NULL;
194         rc = class_detach(obd, lcfg);
195         if (rc)
196                 GOTO(lcfg_cleanup, rc);
197         mdd->mdd_obd_dev = NULL;
198
199         EXIT;
200 lcfg_cleanup:
201         return rc;
202 }
203
204 int mdd_get_md(const struct lu_env *env, struct mdd_object *obj,
205                void *md, int *md_size, const char *name)
206 {
207         int rc;
208         ENTRY;
209
210         rc = mdo_xattr_get(env, obj, mdd_buf_get(env, md, *md_size), name,
211                            mdd_object_capa(env, obj));
212         /*
213          * XXX: Handling of -ENODATA, the right way is to have ->do_md_get()
214          * exported by dt layer.
215          */
216         if (rc == 0 || rc == -ENODATA) {
217                 *md_size = 0;
218                 rc = 0;
219         } else if (rc < 0) {
220                 CDEBUG(D_OTHER, "Error %d reading eadata - %d\n",
221                        rc, *md_size);
222         } else {
223                 /* XXX: Convert lov EA but fixed after verification test. */
224                 *md_size = rc;
225         }
226
227         RETURN(rc);
228 }
229
230 int mdd_get_md_locked(const struct lu_env *env, struct mdd_object *obj,
231                       void *md, int *md_size, const char *name)
232 {
233         int rc = 0;
234         mdd_read_lock(env, obj, MOR_TGT_CHILD);
235         rc = mdd_get_md(env, obj, md, md_size, name);
236         mdd_read_unlock(env, obj);
237         return rc;
238 }
239
240 static int mdd_lov_set_stripe_md(const struct lu_env *env,
241                                  struct mdd_object *obj, struct lu_buf *buf,
242                                  struct thandle *handle)
243 {
244         struct mdd_device       *mdd = mdo2mdd(&obj->mod_obj);
245         struct obd_device       *obd = mdd2obd_dev(mdd);
246         struct obd_export       *lov_exp = obd->u.mds.mds_lov_exp;
247         struct lov_stripe_md    *lsm = NULL;
248         int rc;
249         ENTRY;
250
251         LASSERT(S_ISDIR(mdd_object_type(obj)) || S_ISREG(mdd_object_type(obj)));
252         rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE, lov_exp, 0,
253                            &lsm, buf->lb_buf);
254         if (rc)
255                 RETURN(rc);
256         obd_free_memmd(lov_exp, &lsm);
257
258         rc = mdd_xattr_set_txn(env, obj, buf, XATTR_NAME_LOV, 0, handle);
259
260         CDEBUG(D_INFO, "set lov ea of "DFID" rc %d \n", PFID(mdo2fid(obj)), rc);
261         RETURN(rc);
262 }
263
264 /*
265  * Permission check is done before call it,
266  * no need check again.
267  */
268 static int mdd_lov_set_dir_md(const struct lu_env *env,
269                               struct mdd_object *obj, struct lu_buf *buf,
270                               struct thandle *handle)
271 {
272         struct lov_user_md *lum = NULL;
273         int rc = 0;
274         ENTRY;
275
276         LASSERT(S_ISDIR(mdd_object_type(obj)));
277         lum = (struct lov_user_md*)buf->lb_buf;
278
279         /* if { size, offset, count } = { 0, -1, 0 } and no pool
280          * (i.e. all default values specified) then delete default
281          * striping from dir. */
282         if (LOVEA_DELETE_VALUES(lum->lmm_stripe_size, lum->lmm_stripe_count,
283                                 lum->lmm_stripe_offset) &&
284             lum->lmm_magic != LOV_USER_MAGIC_V3) {
285                 rc = mdd_xattr_set_txn(env, obj, &LU_BUF_NULL,
286                                        XATTR_NAME_LOV, 0, handle);
287                 if (rc == -ENODATA)
288                         rc = 0;
289                 CDEBUG(D_INFO, "delete lov ea of "DFID" rc %d \n",
290                                 PFID(mdo2fid(obj)), rc);
291         } else {
292                 rc = mdd_lov_set_stripe_md(env, obj, buf, handle);
293         }
294         RETURN(rc);
295 }
296
297 int mdd_lsm_sanity_check(const struct lu_env *env,  struct mdd_object *obj)
298 {
299         struct lu_attr   *tmp_la = &mdd_env_info(env)->mti_la;
300         struct md_ucred  *uc     = md_ucred(env);
301         int rc;
302         ENTRY;
303
304         rc = mdd_la_get(env, obj, tmp_la, BYPASS_CAPA);
305         if (rc)
306                 RETURN(rc);
307
308         if ((uc->mu_fsuid != tmp_la->la_uid) &&
309             !mdd_capable(uc, CFS_CAP_FOWNER))
310                 rc = mdd_permission_internal_locked(env, obj, tmp_la,
311                                                     MAY_WRITE, MOR_TGT_CHILD);
312
313         RETURN(rc);
314 }
315
316 int mdd_lov_set_md(const struct lu_env *env, struct mdd_object *pobj,
317                    struct mdd_object *child, struct lov_mds_md *lmmp,
318                    int lmm_size, struct thandle *handle, int set_stripe)
319 {
320         struct lu_buf *buf;
321         cfs_umode_t mode;
322         int rc = 0;
323         ENTRY;
324
325         buf = mdd_buf_get(env, lmmp, lmm_size);
326         mode = mdd_object_type(child);
327         if (S_ISREG(mode) && lmm_size > 0) {
328                 if (set_stripe) {
329                         rc = mdd_lov_set_stripe_md(env, child, buf, handle);
330                 } else {
331                         rc = mdd_xattr_set_txn(env, child, buf,
332                                                XATTR_NAME_LOV, 0, handle);
333                 }
334         } else if (S_ISDIR(mode)) {
335                 if (lmmp == NULL && lmm_size == 0) {
336                         struct mdd_device *mdd = mdd_obj2mdd_dev(child);
337                         struct lov_mds_md *lmm = mdd_max_lmm_get(env, mdd);
338                         int size = sizeof(struct lov_mds_md_v3);
339
340                         /* Get parent dir stripe and set */
341                         if (pobj != NULL)
342                                 rc = mdd_get_md_locked(env, pobj, lmm, &size,
343                                                        XATTR_NAME_LOV);
344                         if (rc > 0) {
345                                 buf = mdd_buf_get(env, lmm, size);
346                                 rc = mdd_xattr_set_txn(env, child, buf,
347                                                        XATTR_NAME_LOV, 0,
348                                                        handle);
349                                 if (rc)
350                                         CERROR("error on copy stripe info: rc "
351                                                 "= %d\n", rc);
352                         }
353                 } else {
354                         LASSERT(lmmp != NULL && lmm_size > 0);
355                         rc = mdd_lov_set_dir_md(env, child, buf, handle);
356                 }
357         }
358         CDEBUG(D_INFO, "Set lov md %p size %d for fid "DFID" rc %d\n",
359                         lmmp, lmm_size, PFID(mdo2fid(child)), rc);
360         RETURN(rc);
361 }
362
363 int mdd_lov_objid_prepare(struct mdd_device *mdd, struct lov_mds_md *lmm)
364 {
365         /* copy mds_lov code is using wrong layer */
366         return mds_lov_prepare_objids(mdd->mdd_obd_dev, lmm);
367 }
368
369 int mdd_declare_lov_objid_update(const struct lu_env *env,
370                                  struct mdd_device *mdd,
371                                  struct thandle *handle)
372 {
373         struct obd_device *obd = mdd2obd_dev(mdd);
374         int size;
375
376         /* in prepare we create local files */
377         if (unlikely(mdd->mdd_capa == NULL))
378                 return 0;
379
380         /* XXX: this is a temporary solution to declare llog changes
381          *      will be fixed in 2.3 with new llog implementation */
382
383         size = obd->u.mds.mds_lov_desc.ld_tgt_count * sizeof(obd_id);
384         return dt_declare_record_write(env, mdd->mdd_capa, size, 0, handle);
385 }
386
387 void mdd_lov_objid_update(struct mdd_device *mdd, struct lov_mds_md *lmm)
388 {
389         /* copy mds_lov code is using wrong layer */
390         mds_lov_update_objids(mdd->mdd_obd_dev, lmm);
391 }
392
393 void mdd_lov_create_finish(const struct lu_env *env, struct mdd_device *mdd,
394                            struct lov_mds_md *lmm, int lmm_size,
395                            const struct md_op_spec *spec)
396 {
397         if (lmm && !spec->no_create)
398                 OBD_FREE_LARGE(lmm, lmm_size);
399 }
400
401 int mdd_lov_create(const struct lu_env *env, struct mdd_device *mdd,
402                    struct mdd_object *parent, struct mdd_object *child,
403                    struct lov_mds_md **lmm, int *lmm_size,
404                    const struct md_op_spec *spec, struct md_attr *ma)
405 {
406         struct obd_device     *obd = mdd2obd_dev(mdd);
407         struct obd_export     *lov_exp = obd->u.mds.mds_lov_exp;
408         struct lu_site        *site = mdd2lu_dev(mdd)->ld_site;
409         struct obdo           *oa;
410         struct lov_stripe_md  *lsm = NULL;
411         const void            *eadata = spec->u.sp_ea.eadata;
412         __u64                  create_flags = spec->sp_cr_flags;
413         struct obd_trans_info *oti = &mdd_env_info(env)->mti_oti;
414         struct lu_attr        *la = &ma->ma_attr;
415         int                    rc = 0;
416         ENTRY;
417
418         if (!md_should_create(create_flags)) {
419                 *lmm_size = 0;
420                 RETURN(0);
421         }
422         oti_init(oti, NULL);
423
424         /* replay case, has objects already, only get lov from eadata */
425         if (spec->no_create != 0) {
426                 *lmm = (struct lov_mds_md *)spec->u.sp_ea.eadata;
427                 *lmm_size = spec->u.sp_ea.eadatalen;
428                 if (*lmm_size == lov_mds_md_size((*lmm)->lmm_stripe_count,
429                                                  (*lmm)->lmm_magic)) {
430                         RETURN(0);
431                 } else {
432                         CERROR("incorrect lsm received during recovery\n");
433                         RETURN(-EPROTO);
434                 }
435         }
436
437         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_ALLOC_OBDO))
438                 GOTO(out_ids, rc = -ENOMEM);
439
440         LASSERT(lov_exp != NULL);
441         oa = &mdd_env_info(env)->mti_oa;
442
443         oa->o_uid = 0; /* must have 0 uid / gid on OST */
444         oa->o_gid = 0;
445         oa->o_seq = mdt_to_obd_objseq(lu_site2md(site)->ms_node_id);
446         oa->o_mode = S_IFREG | 0600;
447         oa->o_id = fid_ver_oid(mdd_object_fid(child));
448         oa->o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLFLAGS |
449                 OBD_MD_FLMODE | OBD_MD_FLUID | OBD_MD_FLGID | OBD_MD_FLGROUP;
450         oa->o_size = 0;
451
452         if (!(create_flags & MDS_OPEN_HAS_OBJS)) {
453                 if (create_flags & MDS_OPEN_HAS_EA) {
454                         LASSERT(eadata != NULL);
455                         rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE, lov_exp,
456                                            0, &lsm, (void*)eadata);
457                         if (rc)
458                                 GOTO(out_oti, rc);
459                 } else {
460                         /* get lov ea from parent and set to lov */
461                         struct lov_mds_md *_lmm;
462                         int _lmm_size = mdd_lov_mdsize(env, mdd);
463
464                         LASSERT(parent != NULL);
465
466                         _lmm = mdd_max_lmm_get(env, mdd);
467                         if (_lmm == NULL)
468                                 GOTO(out_oti, rc = -ENOMEM);
469
470                         rc = mdd_get_md_locked(env, parent, _lmm,
471                                                &_lmm_size,
472                                                XATTR_NAME_LOV);
473                         if (rc > 0) {
474                                 _lmm_size = mdd_lov_mdsize(env, mdd);
475                                 rc = obd_iocontrol(OBD_IOC_LOV_SETSTRIPE,
476                                                    lov_exp, _lmm_size,
477                                                    &lsm, _lmm);
478                         }
479                         if (rc)
480                                 GOTO(out_oti, rc);
481                 }
482
483                 OBD_FAIL_TIMEOUT(OBD_FAIL_MDS_OPEN_WAIT_CREATE, 10);
484                 rc = obd_create(env, lov_exp, oa, &lsm, oti);
485                 if (rc) {
486                         if (rc > 0) {
487                                 CERROR("Create error for "DFID": %d\n",
488                                        PFID(mdo2fid(child)), rc);
489                                 rc = -EIO;
490                         }
491                         GOTO(out_oti, rc);
492                 }
493
494                 if (ma->ma_valid & MA_LAY_GEN)
495                         /* If we already have a lsm, the file is not new and we
496                          * are about to change the layout, so we have to bump
497                          * the generation. It is worth noting that old versions
498                          * will be confused by a non-zero gen, that's why
499                          * OBD_INCOMPAT_LMM_VER has been introduced */
500                         lsm->lsm_layout_gen = ma->ma_layout_gen + 1;
501                 else
502                         /* Start with a null generation for backward
503                          * compatiblity with old versions */
504                         lsm->lsm_layout_gen = 0;
505
506                 LASSERT_SEQ_IS_MDT(lsm->lsm_object_seq);
507         } else {
508                 LASSERT(eadata != NULL);
509                 rc = obd_iocontrol(OBD_IOC_LOV_SETEA, lov_exp, 0, &lsm,
510                                    (void*)eadata);
511                 if (rc)
512                         GOTO(out_oti, rc);
513
514                 if (ma->ma_valid & MA_LAY_GEN)
515                         lsm->lsm_layout_gen = ma->ma_layout_gen;
516                 else
517                         lsm->lsm_layout_gen = 0;
518         }
519
520         lsm->lsm_object_id = fid_ver_oid(mdd_object_fid(child));
521         lsm->lsm_object_seq = fid_seq(mdd_object_fid(child));
522         /*
523          * Sometimes, we may truncate some object(without lsm) then open it
524          * (with write flags), so creating lsm above.  The Nonzero(truncated)
525          * size should tell ost, since size attr is in charge by OST.
526          */
527         if (la->la_size && la->la_valid & LA_SIZE) {
528                 struct obd_info *oinfo = &mdd_env_info(env)->mti_oi;
529
530                 memset(oinfo, 0, sizeof(*oinfo));
531
532                 /* When setting attr to ost, FLBKSZ is not needed. */
533                 oa->o_valid &= ~OBD_MD_FLBLKSZ;
534                 obdo_from_la(oa, la, LA_TYPE | LA_ATIME | LA_MTIME |
535                                      LA_CTIME | LA_SIZE);
536                 /*
537                  * XXX: Pack lustre id to OST, in OST, it will be packed by
538                  * filter_fid, but can not see what is the usages. So just pack
539                  * o_seq o_ver here, maybe fix it after this cycle.
540                  */
541                 obdo_set_parent_fid(oa, mdd_object_fid(child));
542                 oinfo->oi_oa = oa;
543                 oinfo->oi_md = lsm;
544                 oinfo->oi_capa = NULL;
545                 oinfo->oi_policy.l_extent.start = la->la_size;
546                 oinfo->oi_policy.l_extent.end = OBD_OBJECT_EOF;
547
548                 rc = obd_punch_rqset(lov_exp, oinfo, oti);
549                 if (rc) {
550                         CERROR("Error setting attrs for "DFID": rc %d\n",
551                                PFID(mdo2fid(child)), rc);
552                         if (rc > 0) {
553                                 CERROR("obd_setattr for "DFID" rc %d\n",
554                                         PFID(mdo2fid(child)), rc);
555                                 rc = -EIO;
556                         }
557                         GOTO(out_oti, rc);
558                 }
559         }
560         /* blksize should be changed after create data object */
561         la->la_valid |= LA_BLKSIZE;
562         la->la_blksize = oa->o_blksize;
563         *lmm = NULL;
564         rc = obd_packmd(lov_exp, lmm, lsm);
565         if (rc < 0) {
566                 CERROR("Cannot pack lsm, err = %d\n", rc);
567                 GOTO(out_oti, rc);
568         }
569         if (mdd_lov_objid_prepare(mdd, *lmm) != 0) {
570                 CERROR("Not have memory for update objid\n");
571                 OBD_FREE(*lmm, rc);
572                 *lmm = NULL;
573                 GOTO(out_oti, rc = -ENOMEM);
574         }
575         *lmm_size = rc;
576         rc = 0;
577         EXIT;
578 out_oti:
579         oti_free_cookies(oti);
580 out_ids:
581         if (lsm)
582                 obd_free_memmd(lov_exp, &lsm);
583
584         return rc;
585 }
586
587 /*
588  * used when destroying orphans and from mds_reint_unlink() when MDS wants to
589  * destroy objects on OSS.
590  */
591 int mdd_lovobj_unlink(const struct lu_env *env, struct mdd_device *mdd,
592                       struct mdd_object *obj, struct lu_attr *la,
593                       struct lov_mds_md *lmm, int lmm_size,
594                       struct llog_cookie *logcookies,
595                       int log_unlink)
596 {
597         struct obd_device     *obd = mdd2obd_dev(mdd);
598         struct obd_export     *lov_exp = obd->u.mds.mds_lov_exp;
599         struct lov_stripe_md  *lsm = NULL;
600         struct obd_trans_info *oti = &mdd_env_info(env)->mti_oti;
601         struct obdo           *oa = &mdd_env_info(env)->mti_oa;
602         struct lu_site        *site = mdd2lu_dev(mdd)->ld_site;
603         int rc;
604         ENTRY;
605
606         if (lmm_size == 0)
607                 RETURN(0);
608
609         rc = obd_unpackmd(lov_exp, &lsm, lmm, lmm_size);
610         if (rc < 0) {
611                 CERROR("Error unpack md %p\n", lmm);
612                 RETURN(rc);
613         } else {
614                 LASSERT(rc >= sizeof(*lsm));
615                 rc = 0;
616         }
617
618         oa->o_id = lsm->lsm_object_id;
619         oa->o_seq = mdt_to_obd_objseq(lu_site2md(site)->ms_node_id);
620         oa->o_mode = la->la_mode & S_IFMT;
621         oa->o_valid = OBD_MD_FLID | OBD_MD_FLTYPE | OBD_MD_FLGROUP;
622
623         oti_init(oti, NULL);
624         if (log_unlink && logcookies) {
625                 oa->o_valid |= OBD_MD_FLCOOKIE;
626                 oti->oti_logcookies = logcookies;
627         }
628
629         CDEBUG(D_INFO, "destroying OSS object "LPU64":"LPU64"\n", oa->o_seq,
630                oa->o_id);
631
632         rc = obd_destroy(env, lov_exp, oa, lsm, oti, NULL, NULL);
633
634         obd_free_memmd(lov_exp, &lsm);
635         RETURN(rc);
636 }
637
638 /*
639  * called with obj locked.
640  */
641 int mdd_lov_destroy(const struct lu_env *env, struct mdd_device *mdd,
642                     struct mdd_object *obj, struct lu_attr *la)
643 {
644         struct md_attr    *ma = &mdd_env_info(env)->mti_ma;
645         int                rc;
646         ENTRY;
647
648         LASSERT(mdd_write_locked(env, obj) != 0);
649
650         if (unlikely(!S_ISREG(mdd_object_type(obj))))
651                 RETURN(0);
652
653         if (unlikely(la->la_nlink != 0)) {
654                 CWARN("Attempt to destroy OSS object when nlink == %d\n",
655                       la->la_nlink);
656                 RETURN(0);
657         }
658
659         ma->ma_lmm_size = mdd_lov_mdsize(env, mdd);
660         ma->ma_lmm = mdd_max_lmm_get(env, mdd);
661         ma->ma_cookie_size = mdd_lov_cookiesize(env, mdd);
662         ma->ma_cookie = mdd_max_cookie_get(env, mdd);
663         if (ma->ma_lmm == NULL || ma->ma_cookie == NULL)
664                 RETURN(rc = -ENOMEM);
665
666         /* get lov ea */
667
668         rc = mdd_get_md(env, obj, ma->ma_lmm, &ma->ma_lmm_size,
669                         XATTR_NAME_LOV);
670
671         if (rc <= 0) {
672                 CWARN("Get lov ea failed for "DFID" rc = %d\n",
673                          PFID(mdo2fid(obj)), rc);
674                 if (rc == 0)
675                         rc = -ENOENT;
676                 RETURN(rc);
677         }
678
679         ma->ma_valid = MA_LOV;
680
681         rc = mdd_unlink_log(env, mdd, obj, ma);
682         if (rc) {
683                 CWARN("mds unlink log for "DFID" failed: %d\n",
684                        PFID(mdo2fid(obj)), rc);
685                 RETURN(rc);
686         }
687
688         if (ma->ma_valid & MA_COOKIE)
689                 rc = mdd_lovobj_unlink(env, mdd, obj, la,
690                                        ma->ma_lmm, ma->ma_lmm_size,
691                                        ma->ma_cookie, 1);
692         RETURN(rc);
693 }
694
695 int mdd_declare_unlink_log(const struct lu_env *env, struct mdd_object *obj,
696                            struct md_attr *ma, struct thandle *handle)
697 {
698         struct mdd_device *mdd = mdo2mdd(&obj->mod_obj);
699         int rc, i;
700         __u16 stripe;
701
702         LASSERT(obj);
703         LASSERT(ma);
704
705         if (!S_ISREG(lu_object_attr(&obj->mod_obj.mo_lu)))
706                 return 0;
707
708         rc = mdd_lmm_get_locked(env, obj, ma);
709         if (rc || !(ma->ma_valid & MA_LOV))
710                 return rc;
711
712         LASSERT(ma->ma_lmm);
713         if (le32_to_cpu(ma->ma_lmm->lmm_magic) != LOV_MAGIC_V1 &&
714                         le32_to_cpu(ma->ma_lmm->lmm_magic) != LOV_MAGIC_V3) {
715                 CERROR("%s: invalid LOV_MAGIC %08x on object "DFID"\n",
716                                 mdd->mdd_obd_dev->obd_name,
717                                 le32_to_cpu(ma->ma_lmm->lmm_magic),
718                                 PFID(lu_object_fid(&obj->mod_obj.mo_lu)));
719                 return -EINVAL;
720         }
721
722         stripe = le16_to_cpu(ma->ma_lmm->lmm_stripe_count);
723         if (stripe == LOV_ALL_STRIPES);
724                 stripe = mdd2obd_dev(mdd)->u.mds.mds_lov_desc.ld_tgt_count;
725
726         for (i = 0; i < stripe; i++) {
727                 rc = mdd_declare_llog_record(env, mdd,
728                                              sizeof(struct llog_unlink_rec),
729                                              handle);
730                 if (rc)
731                         return rc;
732         }
733
734         return rc;
735 }
736
737 int mdd_unlink_log(const struct lu_env *env, struct mdd_device *mdd,
738                    struct mdd_object *mdd_cobj, struct md_attr *ma)
739 {
740         LASSERT(ma->ma_valid & MA_LOV);
741
742         if ((ma->ma_cookie_size > 0) &&
743             (mds_log_op_unlink(mdd2obd_dev(mdd), ma->ma_lmm, ma->ma_lmm_size,
744                                ma->ma_cookie, ma->ma_cookie_size) > 0)) {
745                 CDEBUG(D_HA, "DEBUG: unlink log is added for object "DFID"\n",
746                        PFID(mdd_object_fid(mdd_cobj)));
747                 ma->ma_valid |= MA_COOKIE;
748         }
749         return 0;
750 }
751
752 int mdd_log_op_setattr(struct obd_device *obd, __u32 uid, __u32 gid,
753                        struct lov_mds_md *lmm, int lmm_size,
754                        struct llog_cookie *logcookies, int cookies_size)
755 {
756         struct mds_obd *mds = &obd->u.mds;
757         struct lov_stripe_md *lsm = NULL;
758         struct llog_setattr64_rec *lsr;
759         struct llog_ctxt *ctxt;
760         int rc;
761         ENTRY;
762
763         if (IS_ERR(mds->mds_lov_obd))
764                 RETURN(PTR_ERR(mds->mds_lov_obd));
765
766         rc = obd_unpackmd(mds->mds_lov_exp, &lsm, lmm, lmm_size);
767         if (rc < 0)
768                 RETURN(rc);
769
770         OBD_ALLOC(lsr, sizeof(*lsr));
771         if (!lsr)
772                 GOTO(out, rc = -ENOMEM);
773
774         /* prepare setattr log record */
775         lsr->lsr_hdr.lrh_len = lsr->lsr_tail.lrt_len = sizeof(*lsr);
776         lsr->lsr_hdr.lrh_type = MDS_SETATTR64_REC;
777         lsr->lsr_uid = uid;
778         lsr->lsr_gid = gid;
779
780         /* write setattr log */
781         ctxt = llog_get_context(obd, LLOG_MDS_OST_ORIG_CTXT);
782         rc = llog_add(ctxt, &lsr->lsr_hdr, lsm, logcookies,
783                       cookies_size / sizeof(struct llog_cookie));
784
785         llog_ctxt_put(ctxt);
786
787         OBD_FREE(lsr, sizeof(*lsr));
788  out:
789         obd_free_memmd(mds->mds_lov_exp, &lsm);
790         RETURN(rc);
791 }
792
793 int mdd_setattr_log(const struct lu_env *env, struct mdd_device *mdd,
794                     const struct md_attr *ma,
795                     struct lov_mds_md *lmm, int lmm_size,
796                     struct llog_cookie *logcookies, int cookies_size)
797 {
798         struct obd_device *obd = mdd2obd_dev(mdd);
799
800         /* journal chown/chgrp in llog, just like unlink */
801         if (lmm_size > 0) {
802                 CDEBUG(D_INFO, "setattr llog for uid/gid=%lu/%lu\n",
803                         (unsigned long)ma->ma_attr.la_uid,
804                         (unsigned long)ma->ma_attr.la_gid);
805                 return mdd_log_op_setattr(obd, ma->ma_attr.la_uid,
806                                           ma->ma_attr.la_gid, lmm,
807                                           lmm_size, logcookies,
808                                           cookies_size);
809         } else
810                 return 0;
811 }
812
813 static int mdd_osc_setattr_async(struct obd_device *obd, __u32 uid, __u32 gid,
814                           struct lov_mds_md *lmm, int lmm_size,
815                           struct llog_cookie *logcookies, const struct lu_fid *parent,
816                           struct obd_capa *oc)
817 {
818         struct mds_obd *mds = &obd->u.mds;
819         struct obd_trans_info oti = { 0 };
820         struct obd_info oinfo = { { { 0 } } };
821         int rc;
822         ENTRY;
823
824         if (OBD_FAIL_CHECK(OBD_FAIL_MDS_OST_SETATTR))
825                 RETURN(0);
826
827         /* first get memory EA */
828         OBDO_ALLOC(oinfo.oi_oa);
829         if (!oinfo.oi_oa)
830                 RETURN(-ENOMEM);
831
832         LASSERT(lmm);
833
834         rc = obd_unpackmd(mds->mds_lov_exp, &oinfo.oi_md, lmm, lmm_size);
835         if (rc < 0) {
836                 CERROR("Error unpack md %p for obj "DFID"\n", lmm,
837                         PFID(parent));
838                 GOTO(out, rc);
839         }
840
841         /* then fill oa */
842         oinfo.oi_oa->o_uid = uid;
843         oinfo.oi_oa->o_gid = gid;
844         oinfo.oi_oa->o_id = oinfo.oi_md->lsm_object_id;
845         oinfo.oi_oa->o_seq = oinfo.oi_md->lsm_object_seq;
846         oinfo.oi_oa->o_valid |= OBD_MD_FLID | OBD_MD_FLGROUP |
847                                 OBD_MD_FLUID | OBD_MD_FLGID;
848         if (logcookies) {
849                 oinfo.oi_oa->o_valid |= OBD_MD_FLCOOKIE;
850                 oti.oti_logcookies = logcookies;
851         }
852
853         obdo_set_parent_fid(oinfo.oi_oa, parent);
854         oinfo.oi_capa = oc;
855
856         /* do async setattr from mds to ost not waiting for responses. */
857         rc = obd_setattr_async(mds->mds_lov_exp, &oinfo, &oti, NULL);
858         if (rc)
859                 CDEBUG(D_INODE, "mds to ost setattr objid 0x"LPX64
860                        " on ost error %d\n", oinfo.oi_md->lsm_object_id, rc);
861 out:
862         if (oinfo.oi_md)
863                 obd_free_memmd(mds->mds_lov_exp, &oinfo.oi_md);
864         OBDO_FREE(oinfo.oi_oa);
865         RETURN(rc);
866 }
867
868 int mdd_lov_setattr_async(const struct lu_env *env, struct mdd_object *obj,
869                           struct lov_mds_md *lmm, int lmm_size,
870                           struct llog_cookie *logcookies)
871 {
872         struct mdd_device   *mdd = mdo2mdd(&obj->mod_obj);
873         struct obd_device   *obd = mdd2obd_dev(mdd);
874         struct lu_attr      *tmp_la = &mdd_env_info(env)->mti_la;
875         const struct lu_fid *fid = mdd_object_fid(obj);
876         int rc = 0;
877         ENTRY;
878
879         mdd_read_lock(env, obj, MOR_TGT_CHILD);
880         rc = mdo_attr_get(env, obj, tmp_la, mdd_object_capa(env, obj));
881         mdd_read_unlock(env, obj);
882         if (rc)
883                 RETURN(rc);
884
885         rc = mdd_osc_setattr_async(obd, tmp_la->la_uid, tmp_la->la_gid, lmm,
886                                    lmm_size, logcookies, fid, NULL);
887         RETURN(rc);
888 }
889
890 static int grouplock_blocking_ast(struct ldlm_lock *lock,
891                                   struct ldlm_lock_desc *desc,
892                                   void *data, int flag)
893 {
894         struct md_attr *ma = data;
895         struct lustre_handle lockh;
896         int rc = 0;
897         ENTRY;
898
899         switch (flag)
900         {
901                 case LDLM_CB_BLOCKING :
902                         /* lock is canceled */
903                         CDEBUG(D_DLMTRACE, "Lock %p is canceled\n", lock);
904
905                         ldlm_lock2handle(lock, &lockh);
906                         rc = ldlm_cli_cancel(&lockh);
907
908                         break;
909                 case LDLM_CB_CANCELING :
910                         CDEBUG(D_DLMTRACE,
911                                "Lock %p has been canceled, do cleaning\n",
912                                lock);
913
914                         if (ma && ma->ma_som)
915                                 OBD_FREE_PTR(ma->ma_som);
916                         if (ma)
917                                 OBD_FREE_PTR(ma);
918                         break;
919                 default:
920                         LBUG();
921         }
922         RETURN(rc);
923 }
924
925 static int grouplock_glimpse_ast(struct ldlm_lock *lock, void *data)
926 {
927         struct ptlrpc_request *req = data;
928         struct ost_lvb *lvb;
929         int rc;
930         struct md_attr *ma;
931         ENTRY;
932
933         ma = lock->l_ast_data;
934
935         req_capsule_extend(&req->rq_pill, &RQF_LDLM_GL_CALLBACK);
936         req_capsule_set_size(&req->rq_pill, &RMF_DLM_LVB, RCL_SERVER,
937                              sizeof(*lvb));
938         rc = req_capsule_server_pack(&req->rq_pill);
939         if (rc) {
940                 CERROR("failed pack reply: %d\n", rc);
941                 GOTO(out, rc);
942         }
943
944         lvb = req_capsule_server_get(&req->rq_pill, &RMF_DLM_LVB);
945
946         if ((ma) && (ma->ma_valid & MA_SOM)) {
947                 lvb->lvb_size = ma->ma_som->msd_size;
948                 lvb->lvb_blocks = ma->ma_som->msd_blocks;
949         } else if ((ma) && (ma->ma_valid & MA_INODE)) {
950                 lvb->lvb_size = ma->ma_attr.la_size;
951                 lvb->lvb_blocks = ma->ma_attr.la_blocks;
952         } else {
953                 lvb->lvb_size = 0;
954                 rc = -ELDLM_NO_LOCK_DATA;
955         }
956
957         EXIT;
958 out:
959         if (rc == -ELDLM_NO_LOCK_DATA)
960                 lustre_pack_reply(req, 1, NULL, NULL);
961
962         req->rq_status = rc;
963         return rc;
964 }
965
966 int mdd_file_lock(const struct lu_env *env, struct md_object *obj,
967                   struct lov_mds_md *lmm, struct ldlm_extent *extent,
968                   struct lustre_handle *lockh)
969 {
970         struct ldlm_enqueue_info einfo = { 0 };
971         struct obd_info oinfo = { { { 0 } } };
972         struct obd_device *obd;
973         struct obd_export *lov_exp;
974         struct lov_stripe_md *lsm = NULL;
975         struct md_attr *ma = NULL;
976         int rc;
977         ENTRY;
978
979         obd = mdo2mdd(obj)->mdd_obd_dev;
980         lov_exp = obd->u.mds.mds_lov_exp;
981
982         obd_unpackmd(lov_exp, &lsm, lmm,
983                      lov_mds_md_size(lmm->lmm_stripe_count, lmm->lmm_magic));
984
985         OBD_ALLOC_PTR(ma);
986         if (ma == NULL)
987                 GOTO(out, rc = -ENOMEM);
988
989         OBD_ALLOC_PTR(ma->ma_som);
990         if (ma->ma_som == NULL)
991                 GOTO(out, rc = -ENOMEM);
992
993         ma->ma_need = MA_SOM | MA_INODE;
994         mo_attr_get(env, obj, ma);
995
996         einfo.ei_type = LDLM_EXTENT;
997         einfo.ei_mode = LCK_GROUP;
998         einfo.ei_cb_bl = grouplock_blocking_ast;
999         einfo.ei_cb_cp = ldlm_completion_ast;
1000         einfo.ei_cb_gl = grouplock_glimpse_ast;
1001
1002         if (ma->ma_valid & (MA_SOM | MA_INODE))
1003                 einfo.ei_cbdata = ma;
1004         else
1005                 einfo.ei_cbdata = NULL;
1006
1007         memset(&oinfo.oi_policy, 0, sizeof(oinfo.oi_policy));
1008         oinfo.oi_policy.l_extent = *extent;
1009         oinfo.oi_lockh = lockh;
1010         oinfo.oi_md = lsm;
1011         oinfo.oi_flags = 0;
1012
1013         rc = obd_enqueue(lov_exp, &oinfo, &einfo, NULL);
1014         /* ei_cbdata is used as a free flag at exit */
1015         if (rc)
1016                 einfo.ei_cbdata = NULL;
1017
1018         obd_unpackmd(lov_exp, &lsm, NULL, 0);
1019
1020 out:
1021         /* ma is freed if not used as callback data */
1022         if ((einfo.ei_cbdata == NULL) && ma && ma->ma_som)
1023                 OBD_FREE_PTR(ma->ma_som);
1024         if ((einfo.ei_cbdata == NULL) && ma)
1025                 OBD_FREE_PTR(ma);
1026
1027         RETURN(rc);
1028 }
1029
1030 int mdd_file_unlock(const struct lu_env *env, struct md_object *obj,
1031                     struct lov_mds_md *lmm, struct lustre_handle *lockh)
1032 {
1033         struct obd_device *obd;
1034         struct obd_export *lov_exp;
1035         struct lov_stripe_md *lsm = NULL;
1036         int rc;
1037         ENTRY;
1038
1039         LASSERT(lustre_handle_is_used(lockh));
1040
1041         obd = mdo2mdd(obj)->mdd_obd_dev;
1042         lov_exp = obd->u.mds.mds_lov_exp;
1043
1044         obd_unpackmd(lov_exp, &lsm, lmm,
1045                      lov_mds_md_size(lmm->lmm_stripe_count, lmm->lmm_magic));
1046
1047         rc = obd_cancel(lov_exp, lsm, LCK_GROUP, lockh);
1048
1049         obd_unpackmd(lov_exp, &lsm, NULL, 0);
1050
1051         RETURN(rc);
1052 }
1053
1054 /* file lov is in ma->ma_lmm */
1055 /* requested lov is in info->mti_spec.u.sp_ea.eadata */
1056 int mdd_lum_lmm_cmp(const struct lu_env *env, struct md_object *cobj,
1057                     const struct md_op_spec *spec, struct md_attr *ma)
1058 {
1059         struct obd_export *lov_exp =
1060                 mdd2obd_dev(mdo2mdd(cobj))->u.mds.mds_lov_exp;
1061         struct lov_mds_md *lmm = ma->ma_lmm;
1062         struct lov_user_md_v3 *lum =
1063                 (struct lov_user_md_v3 *)(spec->u.sp_ea.eadata);
1064         struct lov_stripe_md *lsm = NULL;
1065         int lmm_magic, rc;
1066         ENTRY;
1067
1068         rc = obd_unpackmd(lov_exp, &lsm, lmm,
1069                           lov_mds_md_size(lmm->lmm_stripe_count,
1070                                           lmm->lmm_magic));
1071         ma->ma_layout_gen = lsm->lsm_layout_gen;
1072         ma->ma_valid |= MA_LAY_GEN;
1073
1074         rc = lov_lum_swab_if_needed(lum, &lmm_magic, NULL);
1075         if (rc)
1076                 GOTO(out, rc);
1077
1078         rc = lov_lum_lsm_cmp((struct lov_user_md *)lum, lsm);
1079         if (rc)
1080                 GOTO(out, rc);  /* keep GOTO to for traces */
1081
1082 out:
1083         /* free lsm */
1084         obd_unpackmd(lov_exp, &lsm, NULL, 0);
1085         return rc;
1086 }